截断一个python datetime对象的经典方法是什么?
在这种特殊情况下,到今天为止。基本上就是将小时,分,秒,微秒设置为0。
我希望输出也是一个datetime对象,而不是字符串。
截断一个python datetime对象的经典方法是什么?
在这种特殊情况下,到今天为止。基本上就是将小时,分,秒,微秒设置为0。
我希望输出也是一个datetime对象,而不是字符串。
当前回答
有一个模块datetime_truncate为您处理这个问题。它只调用datetime。replace。
其他回答
如果您正在处理DateTime类型的Series,有一种更有效的方法来截断它们,特别是当Series对象有很多行时。
您可以使用楼层功能
例如,如果你想把它截断为小时:
生成一个日期范围
times = pd.Series(pd.date_range(start='1/1/2018 04:00:00', end='1/1/2018 22:00:00', freq='s'))
我们可以比较替换和地板功能的运行时间来检查它。
%timeit times.apply(lambda x : x.replace(minute=0, second=0, microsecond=0))
>>> 341 ms ± 18.2 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
%timeit times.dt.floor('h')
>>>>2.26 ms ± 451 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
我觉得这就是你要找的…
>>> import datetime
>>> dt = datetime.datetime.now()
>>> dt = dt.replace(hour=0, minute=0, second=0, microsecond=0) # Returns a copy
>>> dt
datetime.datetime(2011, 3, 29, 0, 0)
但如果你真的不关心时间方面的事情,那么你真的应该只传递日期对象……
>>> d_truncated = datetime.date(dt.year, dt.month, dt.day)
>>> d_truncated
datetime.date(2011, 3, 29)
有一个模块datetime_truncate为您处理这个问题。它只调用datetime。replace。
您可以使用熊猫(尽管它可能是该任务的开销)。你可以使用round, floor和celll来表示常用的数字,也可以使用任何熊猫频率的偏移别名:
import pandas as pd
import datetime as dt
now = dt.datetime.now()
pd_now = pd.Timestamp(now)
freq = '1d'
pd_round = pd_now.round(freq)
dt_round = pd_round.to_pydatetime()
print(now)
print(dt_round)
"""
2018-06-15 09:33:44.102292
2018-06-15 00:00:00
"""
详见https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.dt.floor.html
现在是2019年,我认为最有效的方法是:
df['truncate_date'] = df['timestamp'].dt.floor('d')