如何正确地设置JVM (1.5.x)使用的默认字符编码?
我读过-Dfile。encoding=任何以前的jvm使用的方式。我没有那种奢侈,原因我就不多说了。
我试过:
System.setProperty("file.encoding", "UTF-8");
并且属性被设置了,但是它似乎没有导致下面最后的getBytes调用使用UTF8:
System.setProperty("file.encoding", "UTF-8");
byte inbytes[] = new byte[1024];
FileInputStream fis = new FileInputStream("response.txt");
fis.read(inbytes);
FileOutputStream fos = new FileOutputStream("response-2.txt");
String in = new String(inbytes, "UTF8");
fos.write(in.getBytes());
我的团队在装有Windows的机器上遇到了同样的问题。然后用两种方法解决了这个问题:
a)设置环境变量(即使在Windows系统首选项中)
JAVA_TOOL_OPTIONS
-Dfile.encoding = UTF8
b)在pom.xml中引入以下片段:
-Dfile.encoding=UTF-8
在
<jvmArguments>
-Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=n,address=8001
-Dfile.encoding=UTF-8
</jvmArguments>
不幸的是,文件。encoding属性必须在JVM启动时指定;当输入主方法时,String.getBytes()使用的字符编码和InputStreamReader和OutputStreamWriter的默认构造函数已经被永久缓存。
正如Edward Grech所指出的,在这种特殊情况下,可以使用环境变量JAVA_TOOL_OPTIONS来指定此属性,但通常是这样做的:
java -Dfile.encoding=UTF-8 … com.x.Main
Charset.defaultCharset()将反映对文件的更改。但是核心Java库中需要确定默认字符编码的大多数代码都不使用这种机制。
当您正在编码或解码时,您可以查询文件。属性或Charset.defaultCharset()来查找当前的默认编码,并使用适当的方法或构造函数重载来指定它。