我有一个由数百列组成的数据框架,我需要看到所有的列名。

我做了什么:

In[37]:
data_all2.columns

输出结果为:

Out[37]:
Index(['customer_id', 'incoming', 'outgoing', 'awan', 'bank', 'family', 'food',
       'government', 'internet', 'isipulsa',
       ...
       'overdue_3months_feature78', 'overdue_3months_feature79',
       'overdue_3months_feature80', 'overdue_3months_feature81',
       'overdue_3months_feature82', 'overdue_3months_feature83',
       'overdue_3months_feature84', 'overdue_3months_feature85',
       'overdue_3months_feature86', 'loan_overdue_3months_total_y'],
      dtype='object', length=102)

我如何显示所有列,而不是一个截断列表?


当前回答

一个快速而简单的解决方案是将其转换为字符串

print('\t'.join(data_all2.columns))

会导致它们全部被打印出来,被制表符隔开 当然,请注意,102个名字都相当长,因此阅读起来有点困难

其他回答

如果你只是想看到所有的列,你可以做一些这样的事情作为快速修复

cols = data_all2.columns

现在cols将表现为一个可以被索引的迭代变量。例如

cols[11:20]

试试这个——

df.columns.values

您可以全局设置打印选项。我认为这是可行的:

方法1:

pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)

方法2:

pd.options.display.max_columns = None
pd.options.display.max_rows = None

这将允许您在执行.head()时查看所有列名和行。任何列名都不会被截断。


如果你只是想看到列名,你可以这样做:

print(df.columns.tolist())

我有很多重复的列名,一旦我运行

df = df.loc[:,~df.columns.duplicated()]

我可以看到完整的列列表

信贷: https://stackoverflow.com/a/40435354/5846417

一个快速而简单的解决方案是将其转换为字符串

print('\t'.join(data_all2.columns))

会导致它们全部被打印出来,被制表符隔开 当然,请注意,102个名字都相当长,因此阅读起来有点困难