我使用的是Ubuntu 14.04中的python 2.7。我用这些命令安装了scikit-learn, numpy和matplotlib:

sudo apt-get install build-essential python-dev python-numpy \
python-numpy-dev python-scipy libatlas-dev g++ python-matplotlib \
ipython

但是当我导入这些包时:

from sklearn.cross_validation import train_test_split

它返回给我这个错误:

ImportError: No module named sklearn.cross_validation

我需要做什么?


当前回答

像这样更改代码

# from sklearn.cross_validation import train_test_split
from sklearn.model_selection import train_test_split

其他回答

过去:从sklearn.cross_validation (从0.20开始,这个包在0.18版本中已弃用,从sklearn import model_selection更改为)。

现在:从sklearn导入model_selection

示例2:

过去:来自sklearn。cross_validation导入cross_val_score(0.18版本已弃用)

现:来自sklearn。导入cross_val_score

如果你有需要运行不同版本的代码,你可以这样做:

import sklearn
if sklearn.__version__ > '0.18':
    from sklearn.model_selection import train_test_split
else:
    from sklearn.cross_validation import train_test_split

但这并不理想,因为您将包版本作为字符串进行比较,这通常有效,但并不总是如此。如果你愿意安装打包,这是一个更好的方法:

from packaging.version import parse
import sklearn
if parse(sklearn.__version__) > parse('0.18'):
    from sklearn.model_selection import train_test_split
else:
    from sklearn.cross_validation import train_test_split

我猜交叉选择已经不活跃了。我们应该用模型选择来代替。您可以从sklearn编写它来运行。导入train_test_split

这是它。

sklearn。Cross_validation现在改为sklearn.model_selection

只改变

sklearn.cross_validation

to

sklearn.model_selection

将数据集分为训练集和测试集

from sklearn.model_selection import train_test_split