如何检索Pandas数据帧中的列数?

如何以编程方式检索pandas数据框架中的列数?我希望是这样的:

df.num_columns

当前回答

#use a regular expression to parse the column count
#https://docs.python.org/3/library/re.html

buffer = io.StringIO()
df.info(buf=buffer)
s = buffer.getvalue()
pat=re.search(r"total\s{1}[0-9]\s{1}column",s)
print(s)
phrase=pat.group(0)
value=re.findall(r'[0-9]+',phrase)[0]
print(int(value))

2021-01-22 21:52:35

其他回答

为了在你的总形状中包含行索引“列”的数量，我个人会将df.columns.size与属性pd.Index.nlevels/pd.MultiIndex.nlevels加在一起:

设置虚拟数据

import pandas as pd

flat_index = pd.Index([0, 1, 2])
multi_index = pd.MultiIndex.from_tuples([("a", 1), ("a", 2), ("b", 1), names=["letter", "id"])

columns = ["cat", "dog", "fish"]

data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
flat_df = pd.DataFrame(data, index=flat_index, columns=columns)
multi_df = pd.DataFrame(data, index=multi_index, columns=columns)

# Show data
# -----------------
# 3 columns, 4 including the index
print(flat_df)
    cat  dog  fish
id                
0     1    2     3
1     4    5     6
2     7    8     9

# -----------------
# 3 columns, 5 including the index
print(multi_df)
           cat  dog  fish
letter id                
a      1     1    2     3
       2     4    5     6
b      1     7    8     9

将我们的过程写成函数:

def total_ncols(df, include_index=False):
    ncols = df.columns.size
    if include_index is True:
        ncols += df.index.nlevels
    return ncols

print("Ignore the index:")
print(total_ncols(flat_df), total_ncols(multi_df))

print("Include the index:")
print(total_ncols(flat_df, include_index=True), total_ncols(multi_df, include_index=True))

这个打印:

Ignore the index:
3 3

Include the index:
4 5

如果你只想包含指标的数量如果指标是pd。MultiIndex，然后你可以在定义的函数中加入isinstance检查。

作为替代，您可以使用df.reset_index().columns。大小来实现相同的结果，但这不会有同样的性能，因为我们临时插入新列到索引中，并在获得列数之前创建一个新索引。

2021-01-21 23:10:44

这为我工作len(list(df))。

2019-01-29 07:19:39

这里是:

熊猫 Excel引擎:xlsxwriter

获得列数的几种方法:

Len (df.columns) -> 28 df。形状[1]-> : df。形状= (592,28) 相关的行数:df。形状[0]-> 592 df.columns。形状[0]-> 这里:df.columns.shape = (28，) Df.columns.size ->

2021-06-08 03:56:56

#use a regular expression to parse the column count
#https://docs.python.org/3/library/re.html

buffer = io.StringIO()
df.info(buf=buffer)
s = buffer.getvalue()
pat=re.search(r"total\s{1}[0-9]\s{1}column",s)
print(s)
phrase=pat.group(0)
value=re.findall(r'[0-9]+',phrase)[0]
print(int(value))

2021-01-22 21:52:35

如果保存数据帧的变量叫做df，那么:

len(df.columns)

给出列数。

对于想知道行数的同学

len(df.index)

对于包含行数和列数的元组:

df.shape

2015-01-26 12:50:07

如何检索Pandas数据帧中的列数?

推荐文章

最新文章

标签