df是一个pandas数据框架。 我想找到所有数字类型的列。 喜欢的东西:
isNumeric = is_numeric(df)
df是一个pandas数据框架。 我想找到所有数字类型的列。 喜欢的东西:
isNumeric = is_numeric(df)
当前回答
def is_type(df, baseType):
import numpy as np
import pandas as pd
test = [issubclass(np.dtype(d).type, baseType) for d in df.dtypes]
return pd.DataFrame(data = test, index = df.columns, columns = ["test"])
def is_float(df):
import numpy as np
return is_type(df, np.float)
def is_number(df):
import numpy as np
return is_type(df, np.number)
def is_integer(df):
import numpy as np
return is_type(df, np.integer)
其他回答
df.select_dtypes(exclude = ['object'])
更新:
df.select_dtypes(include= np.number)
或者是熊猫的新版本
df.select_dtypes('number')
你可以使用DataFrame的select_dtypes方法。它包括include和exclude两个参数。所以isNumeric看起来是这样的:
numerics = ['int16', 'int32', 'int64', 'float16', 'float32', 'float64']
newdf = df.select_dtypes(include=numerics)
请参阅以下代码:
if(dataset.select_dtypes(include=[np.number]).shape[1] > 0):
display(dataset.select_dtypes(include=[np.number]).describe())
if(dataset.select_dtypes(include=[np.object]).shape[1] > 0):
display(dataset.select_dtypes(include=[np.object]).describe())
通过这种方式,您可以检查值是数值,如float和int还是srting值。第二个if语句用于检查对象引用的字符串值。
简单的一行程序:
df.select_dtypes('number').columns
调整这个答案,你可以做到
df.ix[:,df.applymap(np.isreal).all(axis=0)]
在这里,np.applymap(np.isreal)显示数据帧中的每个单元格是否都是数值,而.axis(all=0)检查列中的所有值是否都为True,并返回一系列可用于索引所需列的布尔值。