我想从Pandas DataFrame中获得列标题的列表。DataFrame将来自用户输入,所以我不知道有多少列或它们将被称为什么。

例如,如果我有一个这样的数据帧:

>>> my_dataframe
    y  gdp  cap
0   1    2    5
1   2    3    9
2   8    7    2
3   3    4    7
4   6    7    7
5   4    8    3
6   8    2    8
7   9    9   10
8   6    6    4
9  10   10    7

我会得到一个这样的列表:

>>> header_list
['y', 'gdp', 'cap']

当前回答

我觉得这个问题值得再解释一下。

正如fixxer所指出的,答案取决于您在项目中使用的Pandas版本。这可以通过pd得到。__version__命令。

如果你出于某种原因像我一样(在Debian 8 (Jessie)上我使用0.14.1)使用比0.16.0更老的Pandas版本,那么你需要使用:

df.keys().tolist()因为没有任何df.keys。Columns方法尚未实现。

这个keys方法的优点是,它甚至可以在更新版本的Pandas中工作,因此更加通用。

其他回答

它可以作为my_datafframe。columns。

在笔记本上

对于IPython笔记本中的数据探索,我的首选方法是:

sorted(df)

这将产生一个易于阅读的字母顺序列表。

在代码存储库中

在代码中,我发现它更明确

df.columns

因为它告诉其他阅读你代码的人你在做什么。

正如Simeon Visser的回答,你可以这样做

list(my_dataframe.columns.values)

or

list(my_dataframe) # For less typing.

但我认为最完美的地方是:

list(my_dataframe.columns)

它是明确的,同时不是不必要的长。

你可以通过以下方式获取值:

list(my_dataframe.columns.values)

你也可以简单地使用(如Ed Chum的回答所示):

list(my_dataframe)

它的简单代码为您:

for i in my_dataframe:
    print(i)

尽管去做