如何将字符串的DataFrame列(dd/mm/yyyy格式)转换为datetime dtype?


当前回答

最简单的方法是使用to_datetime:

df['col'] = pd.to_datetime(df['col'])

它还为欧洲时报提供了一个日优先的参数(但注意这不是严格的)。

下面是它的实际情况:

In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0   2005-05-23 00:00:00
dtype: datetime64[ns]

你可以传递一个特定的格式:

In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0   2005-05-23
dtype: datetime64[ns]

其他回答

最简单的方法是使用to_datetime:

df['col'] = pd.to_datetime(df['col'])

它还为欧洲时报提供了一个日优先的参数(但注意这不是严格的)。

下面是它的实际情况:

In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0   2005-05-23 00:00:00
dtype: datetime64[ns]

你可以传递一个特定的格式:

In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0   2005-05-23
dtype: datetime64[ns]

如果日期列是'2017-01-01'格式的字符串 您可以使用pandas astype将其转换为datetime。

df['date'] = df['date'].astype('datetime64[ns]')

或者使用datetime64[D]如果你想要日精度而不是纳秒

print(type(df_launath['date'].iloc[0])) 

收益率

<class 'pandas._libs.tslib.Timestamp'>

与使用pandas.to_datetime时相同

您可以尝试其他格式,然后'%Y-%m-%d',但至少这是可行的。

试试这个解决方案:

将“2022-12-31 00:00:00”更改为“2022-12-31 00:00:01” 然后运行以下代码:pandas.to_datetime(pandas. to_datetime)系列([' 2022-12-31 00:00:01 '])) 输出:2022-12-31 00:00:01

如果你想指定复杂的格式,你可以使用下面的方法:

df['date_col'] =  pd.to_datetime(df['date_col'], format='%d/%m/%Y')

更多关于格式的细节:

Python 2 https://docs.python.org/2/library/datetime.html#strftime-strptime-behavior Python 3 https://docs.python.org/3.7/library/datetime.html#strftime-strptime-behavior

如果在日期中混合使用了多种格式,请不要忘记设置infer_datetime_format=True,以便简化工作。

df[数据]= pd。to_datetime (df[’date’],infer_datetime_format = True)

来源:pd.to_datetime

或者如果你想要一个定制的方法:

def autoconvert_datetime(value):
    formats = ['%m/%d/%Y', '%m-%d-%y']  # formats to try
    result_format = '%d-%m-%Y'  # output format
    for dt_format in formats:
        try:
            dt_obj = datetime.strptime(value, dt_format)
            return dt_obj.strftime(result_format)
        except Exception as e:  # throws exception when format doesn't match
            pass
    return value  # let it be if it doesn't match

df['date'] = df['date'].apply(autoconvert_datetime)