如何找到每个系数的p值(显著性)?
如何找到每个系数的p值(显著性)?
我有一个熊猫数据框架,我想把它分为3个单独的集。我知道使用sklearn中的train_test_split。交叉验证,可以将数据分为两组(训练和测试)。然而,我无法找到将数据分成三组的任何解决方案。
我知道我可以实现这样一个均方根误差函数:如果这个rmse函数是在某个库中实现的,可能是在scipy或scikit-learn中,我在寻找什么?
我使用sklearn和有一个问题的亲和传播。我已经建立了一个输入矩阵,我一直得到以下错误。我已经跑了我试着用去除掉无限值,但这也没用。我要怎么做才能去掉矩阵中的无穷大值,这样我就可以使用亲和传播算法了
我使用的是Ubuntu 14.04中的python 2.7。我用这些命令安装了scikit-learn, numpy和matplotlib:但是当我导入这些包时:它返回给我这个错误:我需要做什么?
如何将训练过的朴素贝叶斯分类器保存到磁盘并使用它来预测数据?我从scikit-learn网站上获得了以下示例程序:
我想将NumPy数组转换为单位向量。更具体地说,我正在寻找这个归一化函数的等效版本:这个函数处理向量v的范数为0的情况。在sklearn或numpy中是否提供了类似的函数?
我试图使用scikit-learn的LabelEncoder来编码字符串标签的pandas DataFrame。由于数据帧有许多(50+)列,我想避免为每一列创建一个LabelEncoder对象;我宁