是否有一个经验法则来最好地将数据划分为训练集和验证集?平分妥当吗?或者相对于验证数据,拥有更多的训练数据是否有明显的优势(反之亦然)?或者这个选择很大程度上取决于应用程序?我主要分别使用80% / 2

如何将训练过的朴素贝叶斯分类器保存到磁盘并使用它来预测数据?我从scikit-learn网站上获得了以下示例程序:

当我用Theano或Tensorflow训练我的神经网络时,它们会在每个纪元报告一个名为“损失”的变量。我该如何解释这个变量呢?更高的损失是好是坏,或者它对我的神经网络的最终性能(准确性)意味着什么?

当我们必须预测分类(或离散)结果的值时,我们使用逻辑回归。我相信我们使用线性回归来预测给定输入值的结果值。那么,这两种方法有什么不同呢?

在人工智能和机器学习方面,监督学习和无监督学习的区别是什么?你能举个例子简单地解释一下吗?

从Udacity的深度学习课程中,y_i的softmax仅仅是指数除以整个Y向量的指数之和:其中S(y_i)是y_i的软最大函数e是指数函数j是no。输入向量Y中的列。我试过以下几种方法:返回:但建议

给定一个一维下标数组:我想把它编码成一个2D数组:

ANN(人工神经网络)和SVM(支持向量机)是监督机器学习和分类的两种流行策略。对于一个特定的项目,通常不清楚哪种方法更好,我确定答案总是“视情况而定”。通常,两者结合使用贝叶斯分类。这些关于Stac

在接下来的TensorFlow函数中,我们必须在最后一层中输入人工神经元的激活。我能理解。但我不明白为什么叫logits?这不是一个数学函数吗?

我一直在为一个投资组合管理工具开发一个内部网站。有很多文本数据,公司名称等。我对一些搜索引擎的能力印象深刻,它们可以非常快速地回答“你的意思是:xxxx”。我需要能够智能地接受用户的查询,并不仅响应原