什么时候应该使用.eval()?我知道它应该允许我“评估我的模型”。我如何在训练时关闭它?使用.eval()的示例训练代码。

我正在训练CNN按主题对文本进行分类。当我使用二进制交叉熵时,我得到~80%的准确率,使用分类交叉熵时,我得到~50%的准确率。我不明白为什么会这样。这是一个多类问题,这是不是意味着我必须使用分类交叉

我已经用CNN训练了一个二元分类模型,下面是我的代码这里,我想要得到每一层的输出就像TensorFlow一样,我该怎么做呢?

我如何初始化网络的权重和偏差(通过例如He或Xavier初始化)?

当我用Theano或Tensorflow训练我的神经网络时,它们会在每个纪元报告一个名为“损失”的变量。我该如何解释这个变量呢?更高的损失是好是坏,或者它对我的神经网络的最终性能(准确性)意味着什么?

如何在PyTorch中保存训练好的模型?我读到过:Torch.save ()/torch.load()用于保存/加载可序列化对象。model.state_dict()/model.load_state

对于任何Keras层(层类),有人能解释一下如何理解input_shape,单位,暗淡等之间的区别吗?例如,文档说单位指定一个层的输出形状。在神经网络的图像中,隐藏层1有4个单元。这是否直接转换为图层

我试图调和我对lstm的理解,并在Christopher Olah在Keras中实现的这篇文章中指出。我正在关注Jason Brownlee写的关于Keras教程的博客。我最困惑的是,将数据序列重塑为

在接下来的TensorFlow函数中,我们必须在最后一层中输入人工神经元的激活。我能理解。但我不明白为什么叫logits?这不是一个数学函数吗?