如何获取Pandas DataFrame的行计数？

如何获取panda数据帧df的行数？

当前回答

TL；DR使用长度（df）

len（）返回列表对象的项数（长度）（也适用于字典、字符串、元组或范围对象）。因此，要获取DataFrame的行计数，只需使用len（df）。有关len函数的更多信息，请参见官方页面。

或者，您可以分别使用df.index和df.columns访问所有行和所有列len（df.index）将给出行数，len（df.columns）将给出列数。

或者，您可以使用df.shape，它一起返回行数和列数（作为元组），在这里您可以使用索引访问每个项。如果要访问行数，请仅使用df.shape[0]。对于列数，请只使用：df.shape[1]。

2016-06-25 05:23:38

其他回答

您也可以这样做：

假设df是您的数据帧。然后df.shape为您提供数据帧的形状，即（行，列）

因此，分配以下命令以获得所需的

 row = df.shape[0], col = df.shape[1]

2020-05-12 07:14:24

对于数据帧df，可以使用以下任一项：

长度（df.索引）df.形状[0]df[df.columns[0]].count（）（==第一列中非NaN值的数量）

再现绘图的代码：

import numpy as np
import pandas as pd
import perfplot

perfplot.save(
    "out.png",
    setup=lambda n: pd.DataFrame(np.arange(n * 3).reshape(n, 3)),
    n_range=[2**k for k in range(25)],
    kernels=[
        lambda df: len(df.index),
        lambda df: df.shape[0],
        lambda df: df[df.columns[0]].count(),
    ],
    labels=["len(df.index)", "df.shape[0]", "df[df.columns[0]].count()"],
    xlabel="Number of rows",
)

2013-04-11 08:24:29

使用len（df）：-）。

__len__（）记录了“返回索引长度”。

计时信息，设置方式与root的答案相同：

In [7]: timeit len(df.index)
1000000 loops, best of 3: 248 ns per loop

In [8]: timeit len(df)
1000000 loops, best of 3: 573 ns per loop

由于有一个额外的函数调用，当然可以说它比直接调用len（df.index）慢一点。但在大多数情况下，这并不重要。我发现len（df）非常可读。

2013-08-19 15:02:45

len（df.index）将是列出的所有方法中工作最快的

2022-08-17 13:13:47

找出数据帧中行数的另一种方法是pandas.Index.size，我认为这是最可读的变体。

请注意，正如我对公认答案的评论，

疑似pandas.Index.size实际上比len（df.Index）更快，但在我的计算机上告诉的是相反的情况（每个循环大约慢150 ns）。

2020-02-24 15:14:22

如何获取Pandas DataFrame的行计数？

推荐文章

最新文章

标签