从熊猫的数据框架中删除无限值?

如何从数据帧中删除nan, inf和-inf值而不重置模式。use_inf_as_null?

我可以告诉dropna包括inf在其缺失值的定义，以便以下工作?

df.dropna(subset=["col1", "col2"], how="all")

当前回答

下面是另一个使用.loc在一个Series上用nan替换inf的方法:

s.loc[(~np.isfinite(s)) & s.notnull()] = np.nan

所以，在回答最初的问题时

df = pd.DataFrame(np.ones((3, 3)), columns=list('ABC'))

for i in range(3): 
    df.iat[i, i] = np.inf

df
          A         B         C
0       inf  1.000000  1.000000
1  1.000000       inf  1.000000
2  1.000000  1.000000       inf

df.sum()
A    inf
B    inf
C    inf
dtype: float64

df.apply(lambda s: s[np.isfinite(s)].dropna()).sum()
A    2
B    2
C    2
dtype: float64

2016-03-03 21:52:22

其他回答

使用选项上下文，无需永久设置use_inf_as_na就可以实现这一点。例如:

with pd.option_context('mode.use_inf_as_na', True):
    df = df.dropna(subset=['col1', 'col2'], how='all')

当然，它可以被设置为永久地将inf视为NaN

pd.set_option('use_inf_as_na', True)

对于旧版本，请将use_inf_as_na替换为use_inf_as_null。

2017-08-17 23:10:32

还有一种解决方案是使用isin方法。使用它来确定每个值是无限的还是缺失的，然后链接all方法来确定行中的所有值是无限的还是缺失的。

最后，使用该结果的负数通过布尔索引选择不全是无穷大或缺失值的行。

all_inf_or_nan = df.isin([np.inf, -np.inf, np.nan]).all(axis='columns')
df[~all_inf_or_nan]

2017-11-03 18:34:37

下面是另一个使用.loc在一个Series上用nan替换inf的方法:

s.loc[(~np.isfinite(s)) & s.notnull()] = np.nan

所以，在回答最初的问题时

df = pd.DataFrame(np.ones((3, 3)), columns=list('ABC'))

for i in range(3): 
    df.iat[i, i] = np.inf

df
          A         B         C
0       inf  1.000000  1.000000
1  1.000000       inf  1.000000
2  1.000000  1.000000       inf

df.sum()
A    inf
B    inf
C    inf
dtype: float64

df.apply(lambda s: s[np.isfinite(s)].dropna()).sum()
A    2
B    2
C    2
dtype: float64

2016-03-03 21:52:22

与这里的其他答案不同，这一行代码适合我。

import numpy as np
df= df[df['required_column_name']!= np.inf]

2022-02-01 10:08:21

上述解决方案将修改不在目标列中的inf。为了解决这个问题，

lst = [np.inf, -np.inf]
to_replace = {v: lst for v in ['col1', 'col2']}
df.replace(to_replace, np.nan)

2014-08-10 02:27:01

从熊猫的数据框架中删除无限值?

推荐文章

最新文章

标签