如何解析ISO 8601格式的日期？

我需要将RFC 3339字符串（如“2008-09-03T20:56:55.450686Z”）解析为Python的datetime类型。

我在Python标准库中找到了strptime，但它不是很方便。

最好的方法是什么？

当前回答

datetime.fromisoformat（）在Python 3.11中得到了改进，可以解析大多数ISO 8601格式

datetime.fromisoformat（）现在可以用于解析大多数ISO 8601格式，只有支持小数小时和分的格式除外。以前，此方法只支持datetime.isoformat（）发出的格式。

>>> from datetime import datetime
>>> datetime.fromisoformat('2011-11-04T00:05:23Z')
datetime.datetime(2011, 11, 4, 0, 5, 23, tzinfo=datetime.timezone.utc)
>>> datetime.fromisoformat('20111104T000523')
datetime.datetime(2011, 11, 4, 0, 5, 23)
>>> datetime.fromisoformat('2011-W01-2T00:05:23.283')
datetime.datetime(2011, 1, 4, 0, 5, 23, 283000)

2022-11-09 04:43:31

其他回答

如果使用熊猫，我可以向熊猫推荐时间戳。在那里你可以

ts_1 = pd.Timestamp('2020-02-18T04:27:58.000Z')    
ts_2 = pd.Timestamp('2020-02-18T04:27:58.000')

Rant：令人难以置信的是，我们仍然需要担心2021的日期字符串解析等问题。

2021-07-28 14:22:38

尝试iso8601模块；它正是这样做的。

python.org wiki上的WorkingWithTime页面上还提到了其他几个选项。

2008-09-24 15:38:17

从Python 3.7开始，您基本上可以使用datetime.datetime.strptime解析RFC 3339日期时间，如下所示：

from datetime import datetime

def parse_rfc3339(datetime_str: str) -> datetime:
    try:
        return datetime.strptime(datetime_str, "%Y-%m-%dT%H:%M:%S.%f%z")
    except ValueError:
        # Perhaps the datetime has a whole number of seconds with no decimal
        # point. In that case, this will work:
        return datetime.strptime(datetime_str, "%Y-%m-%dT%H:%M:%S%z")

这有点尴尬，因为我们需要尝试两种不同的格式字符串，以便同时支持小数秒的日期时间（如2022-01-01T12:12:12.123Z）和没有小数秒的（如2021-01-01T12:12Z），这两种格式在RFC 3339下都是有效的。但只要我们做一点逻辑，这就行得通。

此方法需要注意的一些注意事项：

它在技术上并不完全支持RFC 3339，因为RFC 3339允许您使用空格而不是t来分隔日期和时间，尽管RFC 3339声称是ISO 8601的概要文件，但ISO 8601不允许这样做。如果您想支持RFC 3339的这种愚蠢的怪癖，可以在函数的开头添加datetime_str=datetime_str.replace（“”，“T”）。我上面的实现比严格的RFC 3339解析器应该更宽松，因为它将允许时区偏移，如+0500而不带冒号，而RFC 3339不支持。如果您不仅想解析known-to-be-RFC-339日期时间，而且还想严格验证您获得的日期时间是否为RFC 3339，请使用另一种方法或添加您自己的逻辑来验证时区偏移格式。这个函数肯定不支持所有的ISO 8601，它包括比RFC 3339更广泛的格式。（例如，2009-W01-1是有效的ISO 8601日期。）它在Python 3.6或更早版本中不起作用，因为在那些旧版本中，%z说明符只匹配+0500或-0430或+0000等时区偏移，而不是+05:00或-04:30或z等RFC 3339时区偏移。

2015-06-07 17:53:25

现在有玛雅：人类的日期时间™, 来自流行的Requests:HTTP for Humans的作者™ 包裹：

>>> import maya
>>> str = '2008-09-03T20:56:35.450686Z'
>>> maya.MayaDT.from_rfc3339(str).datetime()
datetime.datetime(2008, 9, 3, 20, 56, 35, 450686, tzinfo=<UTC>)

2018-09-24 18:21:02

python dateutil中的等参函数

python dateutil包具有dateutil.parser.isose，不仅可以解析RFC 3339日期时间字符串（如问题中的字符串），还可以解析其他不符合RFC 3339的ISO 8601日期和时间字符串（例如没有UTC偏移量的字符串，或仅表示日期的字符串）。

>>> import dateutil.parser
>>> dateutil.parser.isoparse('2008-09-03T20:56:35.450686Z') # RFC 3339 format
datetime.datetime(2008, 9, 3, 20, 56, 35, 450686, tzinfo=tzutc())
>>> dateutil.parser.isoparse('2008-09-03T20:56:35.450686') # ISO 8601 extended format
datetime.datetime(2008, 9, 3, 20, 56, 35, 450686)
>>> dateutil.parser.isoparse('20080903T205635.450686') # ISO 8601 basic format
datetime.datetime(2008, 9, 3, 20, 56, 35, 450686)
>>> dateutil.parser.isoparse('20080903') # ISO 8601 basic format, date only
datetime.datetime(2008, 9, 3, 0, 0)

python dateutil包还具有dateutil.parser.parse。与isose相比，它可能不那么严格，但这两个函数都非常宽容，都会尝试解释传入的字符串。如果要消除任何误读的可能性，需要使用比这两个函式更严格的函数。

与Python 3.7+内置datetime.datetime.fromisoformat的比较

dateutil.parser.isorse是一个完整的ISO-8601格式解析器，但在Python≤3.10中，fromsoformat故意不是。在Python 3.11中，fromsoformat支持有效ISO 8601中的几乎所有字符串。请参阅isoformat的文档以了解此警告。（参见此答案）。

2013-03-05 15:44:16

如何解析ISO 8601格式的日期？

推荐文章

最新文章

标签