将索引数组转换为NumPy中的单热编码数组

给定一个一维下标数组:

a = array([1, 0, 3])

我想把它编码成一个2D数组:

b = array([[0,1,0,0], [1,0,0,0], [0,0,0,1]])

当前回答

这种类型的编码通常是numpy数组的一部分。如果你使用numpy数组，像这样:

a = np.array([1,0,3])

然后有一个非常简单的方法将其转换为1-hot编码

out = (np.arange(4) == a[:,None]).astype(np.float32)

就是这样。

2018-08-30 06:36:17

其他回答

你可以使用sklearn.预处理。labelbinarizer:

例子:

import sklearn.preprocessing
a = [1,0,3]
label_binarizer = sklearn.preprocessing.LabelBinarizer()
label_binarizer.fit(range(max(a)+1))
b = label_binarizer.transform(a)
print('{0}'.format(b))

输出:

[[0 1 0 0]
 [1 0 0 0]
 [0 0 0 1]]

除此之外，你可以初始化sklearn.pre - processing. labelbinarizer()，这样transform的输出是稀疏的。

2017-02-16 02:15:32

以下是我认为有用的方法:

def one_hot(a, num_classes):
  return np.squeeze(np.eye(num_classes)[a.reshape(-1)])

这里num_classes表示您拥有的类的数量。如果你有一个形状为(10000，)的向量，这个函数将它转换为(10000,C)注意，a是零索引，即one_hot(np。数组([0,1])，2)将给出[[1,0]，[0,1]]。

我相信这正是你想要的。

PS:源代码是Sequence models - deeplearning.ai

2018-03-11 07:41:09

你也可以使用numpy的eye函数:

numpy。眼(类数)[包含标签的向量]

2018-04-12 07:14:13

我发现最简单的解决方案结合np。拿着和眼睛

def one_hot(x, depth: int):
  return np.take(np.eye(depth), x, axis=0)

对任何形状的x都成立。

2022-02-03 00:05:24

这种类型的编码通常是numpy数组的一部分。如果你使用numpy数组，像这样:

a = np.array([1,0,3])

然后有一个非常简单的方法将其转换为1-hot编码

out = (np.arange(4) == a[:,None]).astype(np.float32)

就是这样。

2018-08-30 06:36:17

将索引数组转换为NumPy中的单热编码数组

推荐文章

最新文章

标签