Pandas DataFrame:根据条件替换列中的所有值

我有一个简单的数据帧如下所示:

我想从“第一赛季”列中选择所有的值，并将那些超过1990年的值替换为1。在这个例子中，只有Baltimore Ravens将1996替换为1(保持其余数据不变)。

我使用了以下方法:

df.loc[(df['First Season'] > 1990)] = 1

但是，它将用1替换该行中的所有值，而不仅仅是“First Season”列中的值。

如何替换这一列的值?

当前回答

我们可以用以下语法更新df中的First Season列:

df['First Season'] = expression_for_new_values

要映射First Season中的值，我们可以使用pandas的.map()方法，语法如下:

data_frame(['column']).map({'initial_value_1':'updated_value_1','initial_value_2':'updated_value_2'})

其他回答

你也可以使用mask替换满足条件的值:

df['First Season'].mask(lambda col: col > 1990, 1)

df['First Season'].loc[(df['First Season'] > 1990)] = 1

奇怪的是没有人知道这个答案，你的代码中唯一缺少的部分是df之后的['First Season']，只需删除里面的花括号。

另一种选择是使用列表推导式:

df['First Season'] = [1 if year > 1990 else year for year in df['First Season']]

我们可以用以下语法更新df中的First Season列:

df['First Season'] = expression_for_new_values

要映射First Season中的值，我们可以使用pandas的.map()方法，语法如下:

data_frame(['column']).map({'initial_value_1':'updated_value_1','initial_value_2':'updated_value_2'})

有点晚了，但仍然-我更喜欢在以下地方使用numpy:

import numpy as np
df['First Season'] = np.where(df['First Season'] > 1990, 1, df['First Season'])

推荐文章