我想从Pandas DataFrame中获得列标题的列表。DataFrame将来自用户输入,所以我不知道有多少列或它们将被称为什么。

例如,如果我有一个这样的数据帧:

>>> my_dataframe
    y  gdp  cap
0   1    2    5
1   2    3    9
2   8    7    2
3   3    4    7
4   6    7    7
5   4    8    3
6   8    2    8
7   9    9   10
8   6    6    4
9  10   10    7

我会得到一个这样的列表:

>>> header_list
['y', 'gdp', 'cap']

当前回答

在笔记本上

对于IPython笔记本中的数据探索,我的首选方法是:

sorted(df)

这将产生一个易于阅读的字母顺序列表。

在代码存储库中

在代码中,我发现它更明确

df.columns

因为它告诉其他阅读你代码的人你在做什么。

其他回答

>>> list(my_dataframe)
['y', 'gdp', 'cap']

要在调试器模式下列出数据帧的列,使用列表理解式:

>>> [c for c in my_dataframe]
['y', 'gdp', 'cap']

顺便说一下,你可以简单地使用sorted:

>>> sorted(my_dataframe)
['cap', 'gdp', 'y']
n = []
for i in my_dataframe.columns:
    n.append(i)
print n

DataFrame遵循类似字典的约定,即遍历对象的“键”。

my_dataframe.keys()

创建一个键/列列表-对象方法to_list()和Pythonic方法:

my_dataframe.keys().to_list()
list(my_dataframe.keys())

DataFrame的基本迭代返回列标签:

[column for column in my_dataframe]

不要将DataFrame转换为列表,只是为了获得列标签。在寻找方便的代码示例时,不要停止思考。

xlarge = pd.DataFrame(np.arange(100000000).reshape(10000,10000))
list(xlarge) # Compute time and memory consumption depend on dataframe size - O(N)
list(xlarge.keys()) # Constant time operation - O(1)

即使之前提供的解决方案很好,我也希望像frame.column_names()这样的东西是Pandas中的一个函数,但由于它不是,也许使用下面的语法会很好。通过调用"tolist"函数,它以某种方式保留了您正在以正确的方式使用pandas的感觉:

frame.columns.tolist()

它的简单代码为您:

for i in my_dataframe:
    print(i)

尽管去做