替换pandas数据框架中的列值

我试图替换一个数据框架的一列的值。列('female')只包含值'female'和'male'。

我尝试过以下方法:

w['female']['female']='1'
w['female']['male']='0'

但收到的是与之前结果完全相同的副本。

理想情况下，我希望得到类似于以下循环元素的输出。

if w['female'] =='female':
    w['female'] = '1';
else:
    w['female'] = '0';

我已经查看了gotchas文档(http://pandas.pydata.org/pandas-docs/stable/gotchas.html)，但不明白为什么什么都没有发生。

任何帮助都将不胜感激。

当前回答

w.replace({'female':{'female':1, 'male':0}}, inplace = True)

上面的代码将把'female'替换为1，'male'替换为0，仅在'female'列中

2020-12-24 12:25:34

其他回答

你也可以使用apply和。get i.e.。

"菲玛"等于"菲玛"克里奥耳语(——“画”:0,可说是家常便饭”:1,.get):

w = pd.DataFrame({'female':['female','male','female']})
print(w)

Dataframe w:

   female
0  female
1    male
2  female

使用apply替换字典中的值:

w['female'] = w['female'].apply({'male':0, 'female':1}.get)
print(w)

结果:

注意:如果数据帧中所有可能的列的值都是在字典else中定义的，那么apply with dictionary应该被使用，对于那些没有在字典中定义的列，它将为空。

2018-03-11 23:30:22

轻微的变化:

w.female.replace(['male', 'female'], [1, 0], inplace=True)

2016-04-30 16:34:40

使用系列。使用Series.fillna映射

如果您的列包含的字符串多于female和male，则Series。map在这种情况下将失败，因为它将为其他值返回NaN。

这就是为什么我们要用fillna来连接它

.map失败的例子:

df = pd.DataFrame({'female':['male', 'female', 'female', 'male', 'other', 'other']})

   female
0    male
1  female
2  female
3    male
4   other
5   other

df['female'].map({'female': '1', 'male': '0'})

0      0
1      1
2      1
3      0
4    NaN
5    NaN
Name: female, dtype: object

对于正确的方法，我们使用fillna进行链映射，所以我们用原始列的值填充NaN:

df['female'].map({'female': '1', 'male': '0'}).fillna(df['female'])

0        0
1        1
2        1
3        0
4    other
5    other
Name: female, dtype: object

2020-01-27 18:08:54

w.female.replace(to_replace=dict(female=1, male=0), inplace=True)

参见pandas.DataFrame.replace()文档。

2016-03-26 15:08:46

dic = {'female':1, 'male':0}
w['female'] = w['female'].replace(dic)

.replace有一个字典作为参数，在这个字典中你可以做任何你想要或需要的事情。

2020-09-27 22:52:01

替换pandas数据框架中的列值

推荐文章

最新文章

标签