如何在熊猫数据帧前或下一个值替换nan ?

假设我有一个带有一些nan的数据框架:

>>> import pandas as pd
>>> df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]])
>>> df
    0   1   2
0   1   2   3
1   4 NaN NaN
2 NaN NaN   9

我需要做的是将每个NaN替换为上面同一列中的第一个非NaN值。假定第一行永远不会包含NaN。对于前面的例子，结果是

我可以一列一列地循环整个DataFrame，一个元素一个元素地循环，然后直接设置值，但是有没有一种简单的(最好是无循环的)方法来实现这一点呢?

当前回答

只是同意ffill方法，但一个额外的信息是，你可以限制向前填充关键字参数限制。

>>> import pandas as pd    
>>> df = pd.DataFrame([[1, 2, 3], [None, None, 6], [None, None, 9]])

>>> df
     0    1   2
0  1.0  2.0   3
1  NaN  NaN   6
2  NaN  NaN   9

>>> df[1].fillna(method='ffill', inplace=True)
>>> df
     0    1    2
0  1.0  2.0    3
1  NaN  2.0    6
2  NaN  2.0    9

现在使用limit关键字参数

>>> df[0].fillna(method='ffill', limit=1, inplace=True)

>>> df
     0    1  2
0  1.0  2.0  3
1  1.0  2.0  6
2  NaN  2.0  9

2019-03-16 14:00:23

其他回答

只是同意ffill方法，但一个额外的信息是，你可以限制向前填充关键字参数限制。

>>> import pandas as pd    
>>> df = pd.DataFrame([[1, 2, 3], [None, None, 6], [None, None, 9]])

>>> df
     0    1   2
0  1.0  2.0   3
1  NaN  NaN   6
2  NaN  NaN   9

>>> df[1].fillna(method='ffill', inplace=True)
>>> df
     0    1    2
0  1.0  2.0    3
1  NaN  2.0    6
2  NaN  2.0    9

现在使用limit关键字参数

>>> df[0].fillna(method='ffill', limit=1, inplace=True)

>>> df
     0    1  2
0  1.0  2.0  3
1  1.0  2.0  6
2  NaN  2.0  9

2019-03-16 14:00:23

只有一个列版本

用最后一个有效值填充NAN

df[column_name].fillna(method='ffill', inplace=True)

用下一个有效值填充NAN

df[column_name].fillna(method='backfill', inplace=True)

2018-12-19 07:45:15

还有熊猫。插值，我认为它提供了更多的控制

import pandas as pd
df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]])

df=df.interpolate(method="pad",limit=None, downcast="infer") #downcast keeps dtype as int 
print(df)  

   0  1  2
0  1  2  3
1  4  2  3
2  4  2  9

2022-12-10 02:31:04

你可以在DataFrame上使用fillna方法，并指定该方法为ffill(前向填充):

>>> df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]])
>>> df.fillna(method='ffill')
   0  1  2
0  1  2  3
1  4  2  3
2  4  2  9

这个方法…

将[s]最后一个有效观测值转发到下一个有效观测值

相反，还有一个bfill方法。

这个方法不会修改DataFrame inplace -你需要将返回的DataFrame重新绑定到一个变量，或者指定inplace=True:

df.fillna(method='ffill', inplace=True)

2015-01-12 15:25:42

可以使用fillna删除或替换NaN值。

南删除

import pandas as pd

df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]])

df.fillna(method='ffill')
     0    1    2
0  1.0  2.0  3.0
1  4.0  2.0  3.0
2  4.0  2.0  9.0

南Replace

df.fillna(0) # 0 means What Value you want to replace 
     0    1    2
0  1.0  2.0  3.0
1  4.0  0.0  0.0
2  0.0  0.0  9.0

参考pandas.DataFrame.fillna

2019-12-22 03:29:27

如何在熊猫数据帧前或下一个值替换nan ?

推荐文章

最新文章

标签