如何转换numpy。对象的Datetime64。datetime(或Timestamp)?
在下面的代码中,我创建了一个datetime、timestamp和datetime64对象。
import datetime
import numpy as np
import pandas as pd
dt = datetime.datetime(2012, 5, 1)
# A strange way to extract a Timestamp object, there's surely a better way?
ts = pd.DatetimeIndex([dt])[0]
dt64 = np.datetime64(dt)
In [7]: dt
Out[7]: datetime.datetime(2012, 5, 1, 0, 0)
In [8]: ts
Out[8]: <Timestamp: 2012-05-01 00:00:00>
In [9]: dt64
Out[9]: numpy.datetime64('2012-05-01T01:00:00.000000+0100')
注意:从Timestamp中很容易得到datetime:
In [10]: ts.to_datetime()
Out[10]: datetime.datetime(2012, 5, 1, 0, 0)
但是我们如何从numpy中提取datetime或Timestamp。datetime64 (dt64) ?
.
更新:在我的数据集中有一个有点讨厌的例子(也许是激励的例子)似乎是:
dt64 = numpy.datetime64('2002-06-28T01:00:00.000000000+0100')
它应该是datetime。datetime(2002,6,28,1,0),而不是long (!) (1025222400000000000L)…
欢迎来到地狱。
你可以将datetime64对象传递给pandas。时间戳:
In [16]: Timestamp(numpy.datetime64('2012-05-01T01:00:00.000000'))
Out[16]: <Timestamp: 2012-05-01 01:00:00>
我注意到这在NumPy 1.6.1中并不能正常工作:
numpy.datetime64('2012-05-01T01:00:00.000000+0100')
同时,熊猫。To_datetime可以使用(这是开发版本之外的,还没有检查v0.9.1):
In [24]: pandas.to_datetime('2012-05-01T01:00:00.000000+0100')
Out[24]: datetime.datetime(2012, 5, 1, 1, 0, tzinfo=tzoffset(None, 3600))
我已经无数次地回到这个答案,所以我决定拼凑一个快速的小类,它将Numpy datetime64值转换为Python datetime值。我希望这能帮助到其他人。
from datetime import datetime
import pandas as pd
class NumpyConverter(object):
@classmethod
def to_datetime(cls, dt64, tzinfo=None):
"""
Converts a Numpy datetime64 to a Python datetime.
:param dt64: A Numpy datetime64 variable
:type dt64: numpy.datetime64
:param tzinfo: The timezone the date / time value is in
:type tzinfo: pytz.timezone
:return: A Python datetime variable
:rtype: datetime
"""
ts = pd.to_datetime(dt64)
if tzinfo is not None:
return datetime(ts.year, ts.month, ts.day, ts.hour, ts.minute, ts.second, tzinfo=tzinfo)
return datetime(ts.year, ts.month, ts.day, ts.hour, ts.minute, ts.second)
我要把它放在我的工具箱里,直觉告诉我我还会用到它。