使用pandas.to_datetime时，只保留日期部分

我用熊猫。To_datetime解析数据中的日期。Pandas默认情况下表示datetime64[ns]的日期，即使这些日期都是每天的。我想知道是否有一种优雅/聪明的方法将日期转换为datetime。[D]这样，当我把数据写入CSV时，日期不会附加00:00:00。我知道我可以逐个元素手动转换类型:

[dt.to_datetime().date() for dt in df.dates]

但这真的很慢，因为我有很多行，这有点违背了使用pandas.to_datetime的目的。是否有一种方法可以一次转换整个列的dtype ?或者，熊猫也一样。to_datetime支持一个精度规范，以便我可以摆脱时间部分，同时与日常数据?

当前回答

转换为datetime64[D]:

df.dates.values.astype('M8[D]')

尽管将其重新分配给DataFrame col会将其恢复为[ns]。

如果你想要实际的datetime.date:

dt = pd.DatetimeIndex(df.dates)
dates = np.array([datetime.date(*date_tuple) for date_tuple in zip(dt.year, dt.month, dt.day)])

2013-04-23 20:07:12

其他回答

从0.15.0版本开始，现在可以很容易地使用.dt来访问date组件:

df['just_date'] = df['dates'].dt.date

上面返回一个日期时间。Date dtype，如果你想要一个datetime64，那么你可以将time组件规范化为midnight，这样它就会将所有值设置为00:00:00:

df['normalised_date'] = df['dates'].dt.normalize()

这将dtype保持为datetime64，但是显示只显示日期值。

Pandas: .dt访问器 pandas.Series.dt

2015-12-14 22:07:34

在>1000000行的表中，我发现这些都是快速的，地板只是稍微快一点:

df['mydate'] = df.index.floor('d')

df['mydate'] = df.index.normalize()

如果你的索引有时区，而你不想在结果中显示这些时区，请执行以下操作:

df['mydate'] = df.index.tz_localize(None).floor('d')

Df.index.date要慢很多倍;To_datetime()更糟糕。两者都有进一步的缺点，结果不能保存到hdf存储，因为它不支持datetime.date类型。

注意，这里我使用索引作为日期源;如果您的源是另一列，则需要添加.dt，例如df.mycol.dt.floor('d')

2020-11-30 13:02:20

转换为datetime64[D]:

df.dates.values.astype('M8[D]')

尽管将其重新分配给DataFrame col会将其恢复为[ns]。

如果你想要实际的datetime.date:

dt = pd.DatetimeIndex(df.dates)
dates = np.array([datetime.date(*date_tuple) for date_tuple in zip(dt.year, dt.month, dt.day)])

2013-04-23 20:07:12

df(“列”)= df(“列”).dt.strftime(“% m / % d / Y %”)

这将给你的只是日期，没有时间在你想要的格式。您可以根据需要更改格式'%m/%d/%Y'它将更改列的数据类型为'object'。

如果你只想要日期而不想要时间的YYYY-MM-DD格式，请使用:

df['Column'] = pd.to_datetime(df['Column']).dt.date

数据类型为“object”。

对于'datetime64'数据类型，使用:

df['Column'] = pd.to_datetime(df['Column']).dt.normalize()

2021-08-05 19:43:49

Pandas DatetimeIndex和Series有一个叫做normalize的方法，它可以做你想做的事情。

你可以在这个答案中了解更多。

它可以用作ser.dt.normalize()

2016-11-02 12:31:05

使用pandas.to_datetime时，只保留日期部分

推荐文章

最新文章

标签