我试图填补一个熊猫数据框架与0的值只有一些列的子集。

当我这样做的时候:

import pandas as pd
df = pd.DataFrame(data={'a':[1,2,3,None],'b':[4,5,None,6],'c':[None,None,7,8]})
print df
df.fillna(value=0, inplace=True)
print df

输出:

     a    b    c
0  1.0  4.0  NaN
1  2.0  5.0  NaN
2  3.0  NaN  7.0
3  NaN  6.0  8.0
     a    b    c
0  1.0  4.0  0.0
1  2.0  5.0  0.0
2  3.0  0.0  7.0
3  0.0  6.0  8.0

它将每个None替换为0。我要做的是,只替换a和b列中的none,而不是c列。

做这件事最好的方法是什么?


当前回答

有时候这个语法不起作用:

df[['col1','col2']] = df[['col1','col2']].fillna()

请使用以下语句:

df['col1','col2']

其他回答

您可以使用dict, fillna与不同的值为不同的列

df.fillna({'a':0,'b':0})
Out[829]: 
     a    b    c
0  1.0  4.0  NaN
1  2.0  5.0  NaN
2  3.0  0.0  7.0
3  0.0  6.0  8.0

在把它分配回来之后

df=df.fillna({'a':0,'b':0})
df
Out[831]: 
     a    b    c
0  1.0  4.0  NaN
1  2.0  5.0  NaN
2  3.0  0.0  7.0
3  0.0  6.0  8.0

使用顶部的答案会产生一个关于更改df片副本的警告。假设你有其他列,更好的方法是传递一个字典: df。fillna({'A': 'NA', 'B': 'NA'}, inplace=True)

你可以选择你想要的列,并通过赋值来完成:

df[['a', 'b']] = df[['a','b']].fillna(value=0)

结果输出如预期的那样:

     a    b    c
0  1.0  4.0  NaN
1  2.0  5.0  NaN
2  3.0  0.0  7.0
3  0.0  6.0  8.0

这应该工作,没有copywarning

df[['a', 'b']] = df.loc[:,['a', 'b']].fillna(value=0)

以下是如何在一行中做到这一点:

df[['a', 'b']].fillna(value=0, inplace=True)

分解:df[['a', 'b']]选择你想要填充NaN值的列,value=0告诉它填充NaN值为零,inplace=True将使更改永久,而不必复制对象。