从Pandas DataFrame列标题中获取一个列表

我想从Pandas DataFrame中获得列标题的列表。DataFrame将来自用户输入，所以我不知道有多少列或它们将被称为什么。

例如，如果我有一个这样的数据帧:

>>> my_dataframe
    y  gdp  cap
0   1    2    5
1   2    3    9
2   8    7    2
3   3    4    7
4   6    7    7
5   4    8    3
6   8    2    8
7   9    9   10
8   6    6    4
9  10   10    7

我会得到一个这样的列表:

>>> header_list
['y', 'gdp', 'cap']

当前回答

它可以作为my_datafframe。columns。

2013-10-20 21:20:06

其他回答

扩展可迭代解包(Python 3.5+): [*df]和Friends

Python 3.5引入了解包泛化(PEP 448)。因此，下面的操作都是可能的。

df = pd.DataFrame('x', columns=['A', 'B', 'C'], index=range(5))
df

   A  B  C
0  x  x  x
1  x  x  x
2  x  x  x
3  x  x  x
4  x  x  x

如果你想要一个列表....

[*df]
# ['A', 'B', 'C']

或者，如果你想要一组，

{*df}
# {'A', 'B', 'C'}

如果你想要一个元组，

*df,  # Please note the trailing comma
# ('A', 'B', 'C')

或者，如果你想把结果存储在某个地方，

*cols, = df  # A wild comma appears, again
cols
# ['A', 'B', 'C']

．.．如果你是那种把咖啡转换成打字声音的人，好吧，这将更有效地消耗你的咖啡;)

附注:如果性能很重要，你会想要抛弃上述解决方案有利于 .tolist df.columns.to_numpy () () # [' a '， ' b '， ' c '] 这与Ed Chum的答案相似，但更新了 V0.24，其中.to_numpy()优先于.values的使用。看到这个答案(由我)为更多的信息。

目视检查

因为我在其他回答中已经看到过这个问题，所以可以使用可迭代解包(不需要显式循环)。

print(*df)
A B C

print(*df, sep='\n')
A
B
C

其他方法的批判

对于可以在单行中完成的操作，不要使用显式for循环(列表推导式是可以的)。

接下来，使用sorted(df)不会保留列的原始顺序。为此，应该使用list(df)。

其次，list(df.columns)和list(df.columns.values)是不好的建议(就当前版本v0.24而言)。Index(从df.columns返回)和NumPy数组(从df.columns.values返回)都定义了.tolist()方法，该方法更快，更习惯。

最后，对于Python 3.4或更早版本，在扩展解包不可用的情况下，应该只使用列表(list(df))作为上述方法的简洁替代。

2019-04-03 09:18:29

正如Simeon Visser的回答，你可以这样做

list(my_dataframe.columns.values)

list(my_dataframe) # For less typing.

但我认为最完美的地方是:

list(my_dataframe.columns)

它是明确的，同时不是不必要的长。

2018-02-16 18:36:08

DataFrame遵循类似字典的约定，即遍历对象的“键”。

my_dataframe.keys()

创建一个键/列列表-对象方法to_list()和Pythonic方法:

my_dataframe.keys().to_list()
list(my_dataframe.keys())

DataFrame的基本迭代返回列标签:

[column for column in my_dataframe]

不要将DataFrame转换为列表，只是为了获得列标签。在寻找方便的代码示例时，不要停止思考。

xlarge = pd.DataFrame(np.arange(100000000).reshape(10000,10000))
list(xlarge) # Compute time and memory consumption depend on dataframe size - O(N)
list(xlarge.keys()) # Constant time operation - O(1)

2014-01-23 17:23:40

它的简单代码为您:

for i in my_dataframe:
    print(i)

尽管去做

2022-08-01 11:54:23

import pandas as pd

# create test dataframe
df = pd.DataFrame('x', columns=['A', 'B', 'C'], index=range(2))

list(df.columns)

['A', 'B', 'C']

2022-04-02 11:49:23

从Pandas DataFrame列标题中获取一个列表

推荐文章

最新文章

标签