我正在尝试将ISO 8601格式的字符串转换为java.util.Date。

我发现模式yyyy-MM-dd'T'HH:mm:ssZ是符合iso8601的,如果使用区域设置(比较样本)。

然而,使用java.text。SimpleDateFormat,我无法转换正确格式化的字符串2010-01-01T12:00:00+01:00。我必须首先将其转换为2010-01-01T12:00:00+0100,不带冒号。

目前的解决方案是

SimpleDateFormat ISO8601DATEFORMAT = new SimpleDateFormat("yyyy-MM-dd'T'HH:mm:ssZ", Locale.GERMANY);
String date = "2010-01-01T12:00:00+01:00".replaceAll("\\+0([0-9]){1}\\:00", "+0$100");
System.out.println(ISO8601DATEFORMAT.parse(date));

这显然不太好。是我错过了什么,还是有更好的解决方案?


回答

感谢JuanZe的评论,我发现了Joda-Time魔法,这里也有描述。

所以解是

DateTimeFormatter parser2 = ISODateTimeFormat.dateTimeNoMillis();
String jtdate = "2010-01-01T12:00:00+01:00";
System.out.println(parser2.parseDateTime(jtdate));

或者更简单地说,通过构造函数使用默认解析器:

DateTime dt = new DateTime( "2010-01-01T12:00:00+01:00" ) ;

对我来说,这很好。


当前回答

另一种解析ISO8601时间戳的简单方法是使用org.apache.commons.lang.time.DateUtils:

import static org.junit.Assert.assertEquals;

import java.text.ParseException;
import java.util.Date;
import org.apache.commons.lang.time.DateUtils;
import org.junit.Test;

public class ISO8601TimestampFormatTest {
  @Test
  public void parse() throws ParseException {
    Date date = DateUtils.parseDate("2010-01-01T12:00:00+01:00", new String[]{ "yyyy-MM-dd'T'HH:mm:ssZZ" });
    assertEquals("Fri Jan 01 12:00:00 CET 2010", date.toString());
  }
}

其他回答

Java有十几种不同的方法来解析日期-时间,这里的回答很好地说明了这一点。但有些令人惊讶的是,没有一个Java的时间类完全实现ISO 8601!

对于Java 8,我建议:

ZonedDateTime zp = ZonedDateTime.parse(string);
Date date = Date.from(zp.toInstant());

这将同时处理UTC格式和偏移量的示例,如“2017-09-13T10:36:40 z”或“2017-09-13T10:36:40+01:00”。它适用于大多数用例。

但它不能处理像“2017-09-13T10:36:40+01”这样的示例,这是一个有效的ISO 8601日期-时间。 它也不会只处理日期,例如。“2017-09-13”。

如果必须处理这些,我建议首先使用regex来嗅探语法。

这里有一个很好的ISO 8601示例列表,其中有很多极端情况:https://www.myintervals.com/blog/2009/05/20/iso-8601-date-validation-that-doesnt-suck/我不知道有任何Java类可以处理所有这些情况。

java.time

注意,在Java 8中,您可以使用Java .time. zoneddatetime类及其静态解析(CharSequence文本)方法。

java.time

java。time API(内置于Java 8及更高版本中),使此操作更容易一些。

如果知道输入是UTC,比如末尾的Z(代表Zulu), Instant类就可以解析。

java.util.Date date = Date.from( Instant.parse( "2014-12-12T10:39:40Z" ));

如果您的输入可能是另一个offset-from-UTC值,而不是末尾的Z (Zulu)所指示的UTC,则使用OffsetDateTime类进行解析。

OffsetDateTime odt = OffsetDateTime.parse( "2010-01-01T12:00:00+01:00" );

然后提取一个Instant,并通过调用。

Instant instant = odt.toInstant();  // Instant is always in UTC.
java.util.Date date = java.util.Date.from( instant );

DatatypeConverter解决方案并不适用于所有虚拟机。以下是我的工作:

javax.xml.datatype.DatatypeFactory.newInstance().newXMLGregorianCalendar("2011-01-01Z").toGregorianCalendar().getTime()

我发现joda不能开箱即用(特别是对于我上面给出的日期上的时区的示例,它应该是有效的)

不幸的是,SimpleDateFormat (Java 6及更早版本)可用的时区格式不符合ISO 8601标准。SimpleDateFormat理解像“GMT+01:00”或“+0100”这样的时区字符串,后者根据rfc# 822。

即使Java 7根据ISO 8601增加了对时区描述符的支持,SimpleDateFormat仍然不能正确地解析一个完整的日期字符串,因为它不支持可选部分。

使用regexp重新格式化输入字符串当然是一种可能,但替换规则不像你的问题那么简单:

有些时区不是UTC的完整小时,因此字符串不一定以“:00”结尾。 ISO8601只允许在时区中包含小时数,因此“+01”相当于“+01:00”。 ISO8601允许使用“Z”来表示UTC而不是“+00:00”。

更简单的解决方案可能是使用JAXB中的数据类型转换器,因为JAXB必须能够根据XML Schema规范解析ISO8601日期字符串。javax.xml.bind.DatatypeConverter.parseDateTime("2010-01-01T12:00:00Z")会给你一个Calendar对象,如果你需要一个Date对象,你可以简单地在它上面使用getTime()。

你可能也可以使用Joda-Time,但我不知道你为什么要费心(更新2022;可能是因为Android的javax.xml包中缺少整个javax.xml.bind部分)。