为什么binary_crossentropy和categorical_crossentropy对同一个问题给出不同的性能?

我正在训练CNN按主题对文本进行分类。当我使用二进制交叉熵时，我得到~80%的准确率，使用分类交叉熵时，我得到~50%的准确率。

我不明白为什么会这样。这是一个多类问题，这是不是意味着我必须使用分类交叉熵而二元交叉熵的结果是没有意义的?

model.add(embedding_layer)
model.add(Dropout(0.25))
# convolution layers
model.add(Conv1D(nb_filter=32,
                    filter_length=4,
                    border_mode='valid',
                    activation='relu'))
model.add(MaxPooling1D(pool_length=2))
# dense layers
model.add(Flatten())
model.add(Dense(256))
model.add(Dropout(0.25))
model.add(Activation('relu'))
# output layer
model.add(Dense(len(class_id_index)))
model.add(Activation('softmax'))

然后我用categorical_crossentropy作为损失函数编译它:

model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

直观地说，我为什么要使用分类交叉熵，我不明白为什么我用二进制得到好的结果，而用分类得到的结果很差。

当前回答

您正在传递一个形状的目标数组(x-dim, y-dim)，同时使用作为损失categorical_crossentropy。Categorical_crossentropy期望目标是形状(样本，类)的二进制矩阵(1和0)。如果你的目标是整数类，你可以通过以下方法将它们转换为预期的格式:

from keras.utils import to_categorical
y_binary = to_categorical(y_int)

或者，您也可以使用损失函数sparse_categorical_crossentropy，它需要整数目标。

model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

2019-04-16 12:38:28

其他回答

from keras.utils import to_categorical
y_binary = to_categorical(y_int)

或者，您也可以使用损失函数sparse_categorical_crossentropy，它需要整数目标。

model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

2019-04-16 12:38:28

这完全取决于你要处理的分类问题的类型。主要有三个类别

二元分类(两个目标类)，多类分类(两个以上专属目标)，多标签分类(两个以上的非排他目标)，其中多个目标类别可以同时打开。

在第一种情况下，应该使用二进制交叉熵，目标应该被编码为单热向量。

在第二种情况下，应使用分类交叉熵，并将目标编码为单热向量。

在最后一种情况下，应该使用二进制交叉熵和目标应该编码为一个热向量。每个输出神经元(或单元)被视为一个单独的随机二进制变量，整个输出向量的损失是单个二进制变量损失的乘积。因此，它是每个单个输出单元的二进制交叉熵的乘积。

二元交叉熵定义为

分类交叉熵定义为

其中c是运行在c类数量上的索引。

2018-03-08 14:34:48

一个简单的例子下一个多类设置来说明

假设您有4个类(其中一个是编码的)，下面只有一个预测

True_label = [0,1,0,0] Predicted_label = [0,0,1,0]

当使用categorical_crossentropy时，准确率仅为0，它只关心你是否得到了相关的类。

然而，当使用binary_crossentropy时，对所有类都计算精度，这个预测的准确率为50%。最终结果将是两种情况下个体准确度的平均值。

对于多类(类是互斥的)问题，建议使用categorical_crossentropy;对于多标签问题，建议使用binary_crossentropy。

2018-12-29 09:13:41

我遇到了一个“倒置”的问题-我用categorical_crossentropy(2个类)得到了很好的结果，而用binary_crossentropy得到了很差的结果。看来问题出在激活函数错了。正确的设置是:

对于binary_crossentropy: sigmoid激活，标量目标对于categorical_crossentropy: softmax激活，单热编码目标

2017-08-01 10:43:45

由于这是一个多类问题，你必须使用categorical_crossentropy，二元交叉熵会产生虚假的结果，很可能只会评估前两个类。

对于一个多类问题，50%的概率是相当不错的，这取决于类的数量。如果您有n个类，那么100/n是通过输出一个随机类可以获得的最小性能。

2017-02-07 15:04:53

为什么binary_crossentropy和categorical_crossentropy对同一个问题给出不同的性能?

推荐文章

最新文章

标签