如何在熊猫数据框架的一列中用零替换NaN值?

我有一个熊猫数据框架如下:

      itm Date                  Amount 
67    420 2012-09-30 00:00:00   65211
68    421 2012-09-09 00:00:00   29424
69    421 2012-09-16 00:00:00   29877
70    421 2012-09-23 00:00:00   30990
71    421 2012-09-30 00:00:00   61303
72    485 2012-09-09 00:00:00   71781
73    485 2012-09-16 00:00:00     NaN
74    485 2012-09-23 00:00:00   11072
75    485 2012-09-30 00:00:00  113702
76    489 2012-09-09 00:00:00   64731
77    489 2012-09-16 00:00:00     NaN

当我尝试应用一个函数到金额列，我得到以下错误:

ValueError: cannot convert float NaN to integer

我尝试使用数学模块中的.isnan应用一个函数我已经尝试了pandas .replace属性我尝试了pandas 0.9中的.sparse data属性我还尝试了在函数中if NaN == NaN语句。我也看了这篇文章我如何替换NA值与零在一个R数据框架?同时看一些其他的文章。我尝试过的所有方法都不起作用或不能识别NaN。任何提示或解决方案将不胜感激。

当前回答

主要有两种选择;在输入或填充缺失值NaN / np时。只有数值替换的Nan(跨列):

df(“金额”)。fillna(value=None, method=，axis=1，)是足够的:

来自文档:

取值:scalar、dict、Series或DataFrame 值用于填充孔(例如0)，交替使用a dict/Series/DataFrame的值，指定用于哪个值每个索引(对于Series)或列(对于DataFrame)。(值不在dict/Series/DataFrame中将不会被填充)。此值不能列个清单。

这意味着'字符串'或'常量'不再允许被赋值。

对于更专门的imputer，使用SimpleImputer():

from sklearn.impute import SimpleImputer
si = SimpleImputer(strategy='constant', missing_values=np.nan, fill_value='Replacement_Value')
df[['Col-1', 'Col-2']] = si.fit_transform(X=df[['C-1', 'C-2']])

2019-07-23 13:36:14

其他回答

已经有很多贡献了，但因为我是新来的，我仍然会提供意见。

在Pandas DataFrame中有两种方法将NaN值替换为0:

fillna():函数使用指定的方法填充NA/NaN值。 Replace (): df.replace()一个简单的方法，用于替换字符串，正则表达式，列表，字典

例子:

#NaN with zero on all columns
df2 = df.fillna(0)


#Using the inplace=True keyword in a pandas method changes the default behaviour.
    df.fillna(0, inplace = True)

# multiple columns appraoch
df[["Student", "ID"]] = df[["Student", "ID"]].fillna(0)

最后是replace()方法:

df["Student"] = df["Student"].replace(np.nan, 0)

2022-01-11 06:59:25

用不同的方法替换不同列中的nan:

   replacement= {'column_A': 0, 'column_B': -999, 'column_C': -99999}
   df.fillna(value=replacement)

2020-03-24 23:38:37

填补缺失值的简单方法:-

填充字符串列:当字符串列有缺失值和NaN值时。

df['string column name'].fillna(df['string column name'].mode().values[0], inplace = True)

填充数字列:当数字列有缺失值和NaN值时。

df['numeric column name'].fillna(df['numeric column name'].mean(), inplace = True)

用零填充NaN:

df['column name'].fillna(0, inplace = True)

2018-07-07 18:31:36

考虑到上表中的特定列Amount是整数类型。以下是一个解决方案:

df['Amount'] = df.Amount.fillna(0).astype(int)

类似地，你可以用各种数据类型来填充它，比如float, str等等。

特别地，我会考虑datatype来比较同一列的不同值。

2019-02-26 11:21:03

您还可以使用字典来填充DataFrame中特定列的NaN值，而不是用一些oneValue填充所有DF。

import pandas as pd

df = pd.read_excel('example.xlsx')
df.fillna( {
        'column1': 'Write your values here',
        'column2': 'Write your values here',
        'column3': 'Write your values here',
        'column4': 'Write your values here',
        .
        .
        .
        'column-n': 'Write your values here'} , inplace=True)

2019-07-16 20:02:37

如何在熊猫数据框架的一列中用零替换NaN值?

推荐文章

最新文章

标签