如果我有一个具有以下列的数据框架:

1. NAME                                     object
2. On_Time                                      object
3. On_Budget                                    object
4. %actual_hr                                  float64
5. Baseline Start Date                  datetime64[ns]
6. Forecast Start Date                  datetime64[ns] 

我想能够说:对于这个数据框架,给我一个列的类型'对象'或类型'datetime'的列表?

我有一个函数,将数字('float64')转换为两个小数点后的位置,我想使用这个特定类型的数据帧列的列表,并通过这个函数将它们全部转换为2dp。

也许是这样的:

For c in col_list: if c.dtype = "Something"
list[]
List.append(c)?

当前回答

我使用infer_objects()

文档字符串:尝试为对象列推断更好的dtype。 尝试对对象类型的列进行软转换,保留非对象 不可转换列不变。推理规则是相同的 与正常的系列/数据框架构建过程一样。

.dtypes df.infer_objects ()

其他回答

如果6年后你仍然有这个问题,这应该可以解决它:)

cols = [c for c in df.columns if df[c].dtype in ['object', 'datetime64[ns]']]

使用dtype将为您提供所需的列的数据类型:

dataframe['column1'].dtype

如果你想一次知道所有列的数据类型,你可以使用dtype的复数作为dtypes:

dataframe.dtypes

从pandas v0.14.1开始,可以使用select_dtypes()按dtype选择列

In [2]: df = pd.DataFrame({'NAME': list('abcdef'),
    'On_Time': [True, False] * 3,
    'On_Budget': [False, True] * 3})

In [3]: df.select_dtypes(include=['bool'])
Out[3]:
  On_Budget On_Time
0     False    True
1      True   False
2     False    True
3      True   False
4     False    True
5      True   False

In [4]: mylist = list(df.select_dtypes(include=['bool']).columns)

In [5]: mylist
Out[5]: ['On_Budget', 'On_Time']

如果你想要一个特定类型的列列表,你可以使用groupby:

>>> df = pd.DataFrame([[1, 2.3456, 'c', 'd', 78]], columns=list("ABCDE"))
>>> df
   A       B  C  D   E
0  1  2.3456  c  d  78

[1 rows x 5 columns]
>>> df.dtypes
A      int64
B    float64
C     object
D     object
E      int64
dtype: object
>>> g = df.columns.to_series().groupby(df.dtypes).groups
>>> g
{dtype('int64'): ['A', 'E'], dtype('float64'): ['B'], dtype('O'): ['C', 'D']}
>>> {k.name: v for k, v in g.items()}
{'object': ['C', 'D'], 'int64': ['A', 'E'], 'float64': ['B']}

我想出了这个三句话。

本质上,它是这样做的:

获取列名及其各自的数据类型。 我可以选择将它输出到csv。


inp = pd.read_csv('filename.csv') # read input. Add read_csv arguments as needed
columns = pd.DataFrame({'column_names': inp.columns, 'datatypes': inp.dtypes})
columns.to_csv(inp+'columns_list.csv', encoding='utf-8') # encoding is optional

这使得我在尝试动态生成模式时更加容易。希望这能有所帮助