使用pandas.to_datetime时，只保留日期部分

我用熊猫。To_datetime解析数据中的日期。Pandas默认情况下表示datetime64[ns]的日期，即使这些日期都是每天的。我想知道是否有一种优雅/聪明的方法将日期转换为datetime。[D]这样，当我把数据写入CSV时，日期不会附加00:00:00。我知道我可以逐个元素手动转换类型:

[dt.to_datetime().date() for dt in df.dates]

但这真的很慢，因为我有很多行，这有点违背了使用pandas.to_datetime的目的。是否有一种方法可以一次转换整个列的dtype ?或者，熊猫也一样。to_datetime支持一个精度规范，以便我可以摆脱时间部分，同时与日常数据?

当前回答

虽然我给EdChum的答案投了赞成票，这是对OP提出的问题最直接的回答，但它并没有真正解决性能问题(它仍然依赖于python datetime对象，因此对它们的任何操作都不会向量化——也就是说，它会很慢)。

更好的替代方法是使用df['dates'].dt.floor('d')。严格来说，它并不是“只保留日期部分”，因为它只是将时间设置为00:00:00。但它确实按照OP的要求工作，例如:

印刷到丝网保存到CSV 使用列进行分组

．.．而且效率更高，因为运算是向量化的。

编辑:事实上，OP们更喜欢的答案可能是“最近版本的熊猫不把时间写入csv，如果所有的观测值都是00:00:00”。

2017-01-18 11:57:38

其他回答

从0.15.0版本开始，现在可以很容易地使用.dt来访问date组件:

df['just_date'] = df['dates'].dt.date

上面返回一个日期时间。Date dtype，如果你想要一个datetime64，那么你可以将time组件规范化为midnight，这样它就会将所有值设置为00:00:00:

df['normalised_date'] = df['dates'].dt.normalize()

这将dtype保持为datetime64，但是显示只显示日期值。

Pandas: .dt访问器 pandas.Series.dt

2015-12-14 22:07:34

只是给一个最新的答案，以防有人看到这篇旧帖子。

在转换为datetime时添加"utc=False"将删除时区组件，并仅保留datetime64[ns]数据类型的日期。

pd.to_datetime(df['Date'], utc=False)

你将能够在excel中保存它而不会得到错误“ValueError: excel不支持带时区的日期时间。在写入Excel之前，请确保日期时间不受时区影响。”

2019-11-17 19:16:20

df(“列”)= df(“列”).dt.strftime(“% m / % d / Y %”)

这将给你的只是日期，没有时间在你想要的格式。您可以根据需要更改格式'%m/%d/%Y'它将更改列的数据类型为'object'。

如果你只想要日期而不想要时间的YYYY-MM-DD格式，请使用:

df['Column'] = pd.to_datetime(df['Column']).dt.date

数据类型为“object”。

对于'datetime64'数据类型，使用:

df['Column'] = pd.to_datetime(df['Column']).dt.normalize()

2021-08-05 19:43:49

如果该列不是datetime格式:

df['DTformat'] = pd.to_datetime(df['col'])

一旦它是datetime格式，你可以将整个列转换为日期，就像这样:

df['DateOnly'] = df['DTformat'].apply(lambda x: x.date())

2022-12-14 00:03:05

印刷到丝网保存到CSV 使用列进行分组

．.．而且效率更高，因为运算是向量化的。

编辑:事实上，OP们更喜欢的答案可能是“最近版本的熊猫不把时间写入csv，如果所有的观测值都是00:00:00”。

2017-01-18 11:57:38

使用pandas.to_datetime时，只保留日期部分

推荐文章

最新文章

标签