使用pandas.to_datetime时，只保留日期部分

我用熊猫。To_datetime解析数据中的日期。Pandas默认情况下表示datetime64[ns]的日期，即使这些日期都是每天的。我想知道是否有一种优雅/聪明的方法将日期转换为datetime。[D]这样，当我把数据写入CSV时，日期不会附加00:00:00。我知道我可以逐个元素手动转换类型:

[dt.to_datetime().date() for dt in df.dates]

但这真的很慢，因为我有很多行，这有点违背了使用pandas.to_datetime的目的。是否有一种方法可以一次转换整个列的dtype ?或者，熊猫也一样。to_datetime支持一个精度规范，以便我可以摆脱时间部分，同时与日常数据?

当前回答

我希望能够更改数据帧中一组列的类型，然后删除保持日期的时间。Round ()， floor()， ceil()都可以工作

df[date_columns] = df[date_columns].apply(pd.to_datetime)
df[date_columns] = df[date_columns].apply(lambda t: t.dt.floor('d'))

2020-05-04 22:20:58

其他回答

Pandas v0.13+:使用带date_format参数的to_csv

尽可能避免将datetime64[ns]系列转换为datetime的对象dtype系列。日期对象。后者通常使用pd.Series.dt构造。date，存储为指针数组，相对于纯基于numpy的序列效率较低。

由于您关心的是写入CSV时的格式，只需使用to_csv的date_format参数。例如:

df.to_csv(filename, date_format='%Y-%m-%d')

有关格式约定，请参阅Python的strftime指令。

2018-12-14 00:19:06

我希望能够更改数据帧中一组列的类型，然后删除保持日期的时间。Round ()， floor()， ceil()都可以工作

df[date_columns] = df[date_columns].apply(pd.to_datetime)
df[date_columns] = df[date_columns].apply(lambda t: t.dt.floor('d'))

2020-05-04 22:20:58

只是给一个最新的答案，以防有人看到这篇旧帖子。

在转换为datetime时添加"utc=False"将删除时区组件，并仅保留datetime64[ns]数据类型的日期。

pd.to_datetime(df['Date'], utc=False)

你将能够在excel中保存它而不会得到错误“ValueError: excel不支持带时区的日期时间。在写入Excel之前，请确保日期时间不受时区影响。”

2019-11-17 19:16:20

简单的解决方案:

df['date_only'] = df['date_time_column'].dt.date

2019-05-20 10:11:16

这是一个提取日期的简单方法:

import pandas as pd

d='2015-01-08 22:44:09' 
date=pd.to_datetime(d).date()
print(date)

2017-12-11 12:02:57

使用pandas.to_datetime时，只保留日期部分

推荐文章

最新文章

标签