截断一个python datetime对象的经典方法是什么?

在这种特殊情况下,到今天为止。基本上就是将小时,分,秒,微秒设置为0。

我希望输出也是一个datetime对象,而不是字符串。


当前回答

有一个模块datetime_truncate为您处理这个问题。它只调用datetime。replace。

其他回答

如果您正在处理DateTime类型的Series,有一种更有效的方法来截断它们,特别是当Series对象有很多行时。

您可以使用楼层功能

例如,如果你想把它截断为小时:

生成一个日期范围

times = pd.Series(pd.date_range(start='1/1/2018 04:00:00', end='1/1/2018 22:00:00', freq='s'))

我们可以比较替换和地板功能的运行时间来检查它。

%timeit times.apply(lambda x : x.replace(minute=0, second=0, microsecond=0))
>>> 341 ms ± 18.2 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

%timeit times.dt.floor('h')
>>>>2.26 ms ± 451 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

我觉得这就是你要找的…

>>> import datetime
>>> dt = datetime.datetime.now()
>>> dt = dt.replace(hour=0, minute=0, second=0, microsecond=0) # Returns a copy
>>> dt
datetime.datetime(2011, 3, 29, 0, 0)

但如果你真的不关心时间方面的事情,那么你真的应该只传递日期对象……

>>> d_truncated = datetime.date(dt.year, dt.month, dt.day)
>>> d_truncated
datetime.date(2011, 3, 29)

有一个模块datetime_truncate为您处理这个问题。它只调用datetime。replace。

您可以使用熊猫(尽管它可能是该任务的开销)。你可以使用round, floor和celll来表示常用的数字,也可以使用任何熊猫频率的偏移别名:

import pandas as pd
import datetime as dt

now = dt.datetime.now()
pd_now = pd.Timestamp(now)

freq = '1d'
pd_round = pd_now.round(freq)
dt_round = pd_round.to_pydatetime()

print(now)
print(dt_round)

"""
2018-06-15 09:33:44.102292
2018-06-15 00:00:00
"""

详见https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.dt.floor.html

现在是2019年,我认为最有效的方法是:

df['truncate_date'] = df['timestamp'].dt.floor('d')