我从CSV文件中加载了一些机器学习数据。前两列是观察结果,其余列是特征。
目前,我做以下事情:
data = pandas.read_csv('mydata.csv')
它会给出如下内容:
data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde'))
我想把这个数据帧切成两个数据帧:一个包含列a和b,一个包含列c, d和e。
不可能写出这样的东西
observations = data[:'c']
features = data['c':]
我不确定最好的方法是什么。我需要一个pd.Panel吗?
顺便说一下,我发现数据帧索引非常不一致:数据['a']是允许的,但数据[0]是不允许的。另一方面,数据['a':]是不允许的,但数据[0:]是允许的。 这有什么实际的原因吗?如果列以Int为索引,这真的很令人困惑,给定data[0] != data[0:1]