如何从数据帧中删除nan, inf和-inf值而不重置模式。use_inf_as_null?

我可以告诉dropna包括inf在其缺失值的定义,以便以下工作?

df.dropna(subset=["col1", "col2"], how="all")

当前回答

与这里的其他答案不同,这一行代码适合我。

import numpy as np
df= df[df['required_column_name']!= np.inf]

其他回答

要使用单个命令删除Nan和inf,请使用

df = df[ np.isfinite( df ).all( axis = 1) ]

如果由于某种原因以上方法对你不起作用,请尝试以下2个步骤:

df = df[ ~( df.isnull().any( axis = 1 ) ) ] #to remove nan
df = df[ ~( df.isin( [np.inf, -np.inf]).any(axis =1) )] #to remove inf

只是偶然发现了这一个,我发现了一行没有替换或numpy:

df = pd.DataFrame(
    [[1, np.inf],
     [1, -np.inf],
     [1, 2]],
    columns=['a', 'b']
)
df.query("b not in [inf, -inf]")
>>> a  b
 2  1  2.0

对于某些版本的pandas,可能需要在列b的名称周围使用back '。

与这里的其他答案不同,这一行代码适合我。

import numpy as np
df= df[df['required_column_name']!= np.inf]

上述解决方案将修改不在目标列中的inf。为了解决这个问题,

lst = [np.inf, -np.inf]
to_replace = {v: lst for v in ['col1', 'col2']}
df.replace(to_replace, np.nan)

首先用NaN替换()infs:

df.replace([np.inf, -np.inf], np.nan, inplace=True)

然后通过dropna()删除nan:

df.dropna(subset=["col1", "col2"], how="all", inplace=True)

例如:

>>> df = pd.DataFrame({"col1": [1, np.inf, -np.inf], "col2": [2, 3, np.nan]})
>>> df
   col1  col2
0   1.0   2.0
1   inf   3.0
2  -inf   NaN

>>> df.replace([np.inf, -np.inf], np.nan, inplace=True)
>>> df
   col1  col2
0   1.0   2.0
1   NaN   3.0
2   NaN   NaN

>>> df.dropna(subset=["col1", "col2"], how="all", inplace=True)
>>> df
   col1  col2
0   1.0   2.0
1   NaN   3.0

同样的方法也适用于级数。