如何获取Pandas DataFrame的行计数？

如何获取panda数据帧df的行数？

当前回答

使用len（df）：-）。

__len__（）记录了“返回索引长度”。

计时信息，设置方式与root的答案相同：

In [7]: timeit len(df.index)
1000000 loops, best of 3: 248 ns per loop

In [8]: timeit len(df)
1000000 loops, best of 3: 573 ns per loop

由于有一个额外的函数调用，当然可以说它比直接调用len（df.index）慢一点。但在大多数情况下，这并不重要。我发现len（df）非常可读。

2013-08-19 15:02:45

其他回答

…建立在Jan Philip Gehrcke的答案之上。

len（df）或len（df.index）比df.shape[0]更快的原因是：

看看代码。df.shape是一个@属性，它运行两次调用len的DataFrame方法。

df.shape??
Type:        property
String form: <property object at 0x1127b33c0>
Source:
# df.shape.fget
@property
def shape(self):
    """
    Return a tuple representing the dimensionality of the DataFrame.
    """
    return len(self.index), len(self.columns)

在len（df）的罩下

df.__len__??
Signature: df.__len__()
Source:
    def __len__(self):
        """Returns length of info axis, but here we use the index """
        return len(self.index)
File:      ~/miniconda2/lib/python2.7/site-packages/pandas/core/frame.py
Type:      instancemethod

len（df.index）将比len（df）稍快，因为它少了一个函数调用，但这总是比df.shape[0]快

2017-12-07 23:37:11

假设df是您的数据帧，那么：

count_row = df.shape[0]  # Gives number of rows
count_col = df.shape[1]  # Gives number of columns

或者更简洁地说，

r, c = df.shape

2016-02-20 13:30:05

找出数据帧中行数的另一种方法是pandas.Index.size，我认为这是最可读的变体。

请注意，正如我对公认答案的评论，

疑似pandas.Index.size实际上比len（df.Index）更快，但在我的计算机上告诉的是相反的情况（每个循环大约慢150 ns）。

2020-02-24 15:14:22

假设数据集是“data”，将数据集命名为“data_fr”，data_fr中的行数为“nu_rows”

#import the data frame. Extention could be different as csv,xlsx or etc.
data_fr = pd.read_csv('data.csv')

#print the number of rows
nu_rows = data_fr.shape[0]
print(nu_rows)

2021-01-02 23:04:44

除了前面的答案之外，您还可以使用df.axes获取具有行和列索引的元组，然后使用len（）函数：

total_rows = len(df.axes[0])
total_cols = len(df.axes[1])

2015-08-19 19:07:17

如何获取Pandas DataFrame的行计数？

推荐文章

最新文章

标签