使用keras和sklearn做类别标签到独热码（one-hot code）转换的区别

1、导入需要的库from keras.utils.np_utils import to_categoricalfrom sklearn import preprocessing2、当使用keras默认参数时（num_classes=None）x = [1, 2, 3]y= to_categorical(x)发现把x分为了4个类别，0、1、2、33、当使用keras自定义参数时（num_classe

马圈圈马

1176人浏览 · 2020-12-02 22:29:46

马圈圈马 · 2020-12-02 22:29:46 发布

1、导入需要的库
from keras.utils.np_utils import to_categorical
from sklearn import preprocessing

2、当使用keras默认参数时（num_classes=None）
x = [1, 2, 3]
y= to_categorical(x)
在这里插入图片描述
发现把x分为了4个类别，0、1、2、3

3、当使用keras自定义参数时（num_classes=num）
x = [1, 2, 3]
y= to_categorical(x, num_classes=5)
在这里插入图片描述
发现把x分为了5个类别，0、1、2、3、4

4、当使用skearn时
lb = preprocessing.LabelBinarizer()
x = [1, 2, 3]
y = lb.fit_transform(x)
在这里插入图片描述
发现把x分为了3个类别，0、1、2

换一个x：
lb = preprocessing.LabelBinarizer()
x = [1, 2, 3]
y = lb.fit_transform(x)
在这里插入图片描述
发现还是把x分为了3个类别，0、1、2

5、总结
1、无参数定义时，keras会把原始类别数字中最大的+1当做独热码处理后类别数
2、有参数定义时，keras会把num_classes当做独热码处理后类别数
3、sklearn则完全不同，它是把原始类别数字不同的个数当做独热码处理后类别数
4、对于连续数据类别可以使用keras（类别数字必须从0开始，条件有些苛刻），也可使用sklearn（无要求）
5、对于离散数据类别建议使用sklearn
6、本人在日常使用中发现sklearn更好用，如果误用keras可能会出错

https://edu.csdn.net/learn/39067/627173?utm_source=2019755004

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

百度文心快码最新评测：功能、应用与实战全攻略-AI产品库

AI编程社区

2025，AI 编程元年，我用 TRAE 做了这些！

AI编程社区

探索如何使用AI编程

第一次沟通没必要拘泥于细节，但是要让ai理解我们的目标。向AI表达“我是谁？我要做什么？，如果可以的话，尽量细化要做什么（分业务模块）。我们为一家计算机零部件制造企业建立一套采购系统，用于采购生产资料，以及公司运营所需的各类物品器材。整个系统所涉及的业务模块包括：- 供应商管理- 物料和品类管理- 组织架构和人员管理- 定价管理：已商定的某供应商的某种物料定价，暂不考虑折扣等功能- 合同管理：合同