每n行有熊猫

Dataframe.resample()仅适用于时间序列数据。我无法从非时间序列数据中找到每n行。最好的方法是什么?

当前回答

df.drop(labels=df[df.index % 3 != 0].index, axis=0) #  every 3rd row (mod 3)

2021-01-17 21:11:51

其他回答

我将使用iloc，它接受一个行/列切片，既基于整数位置，又遵循正常的python语法。如果你想要每5行:

df.iloc[::5, :]

2014-07-31 11:25:16

df.drop(labels=df[df.index % 3 != 0].index, axis=0) #  every 3rd row (mod 3)

2021-01-17 21:11:51

虽然@chrisb接受的答案确实回答了这个问题，但我想补充以下内容。

我使用一个简单的方法来获取第n个数据或删除第n行如下:

df1 = df[df.index % 3 != 0]  # Excludes every 3rd row starting from 0
df2 = df[df.index % 3 == 0]  # Selects every 3rd raw starting from 0

这种基于算法的采样能够支持更复杂的行选择。

当然，这假设您有一个从0开始的有序连续整数的索引列。

2017-09-10 13:22:54

我有类似的要求，但我想要特定组中的第n项。我就是这样解出来的。

groups = data.groupby(['group_key'])
selection = groups['index_col'].apply(lambda x: x % 3 == 0)
subset = data[selection]

2018-12-08 05:00:20

将reset_index()添加到metastableB的答案中允许您只需要假设行是有序且连续的。

df1 = df[df.reset_index().index % 3 != 0]  # Excludes every 3rd row starting from 0
df2 = df[df.reset_index().index % 3 == 0]  # Selects every 3rd row starting from 0

df.reset_index()。Index将创建一个从0开始，以1为增量的索引，允许您轻松使用模数。

2021-06-16 21:05:02

每n行有熊猫

推荐文章

最新文章

标签