设置默认的Java字符编码

如何正确地设置JVM (1.5.x)使用的默认字符编码?

我读过-Dfile。encoding=任何以前的jvm使用的方式。我没有那种奢侈，原因我就不多说了。

我试过:

System.setProperty("file.encoding", "UTF-8");

并且属性被设置了，但是它似乎没有导致下面最后的getBytes调用使用UTF8:

System.setProperty("file.encoding", "UTF-8");

byte inbytes[] = new byte[1024];

FileInputStream fis = new FileInputStream("response.txt");
fis.read(inbytes);
FileOutputStream fos = new FileOutputStream("response-2.txt");
String in = new String(inbytes, "UTF8");
fos.write(in.getBytes());

当前回答

最近，我偶然接触了一家本地公司的Notes 6.5系统，发现在非中文本地Windows安装系统上，web邮件会显示无法识别的字符。我在网上查了几周，几分钟前才发现:

在Java属性中，将以下字符串添加到Runtime Parameters

-Dfile.encoding=MS950 -Duser.language=zh -Duser.country=TW -Dsun.jnu.encoding=MS950

在这种情况下，UTF-8设置将不起作用。

2017-10-14 17:14:47

其他回答

我不能回答你最初的问题，但我想给你一些建议——不要依赖JVM的默认编码。最好显式地指定所需的编码(例如:"UTF-8")。这样，您就知道它即使跨不同的系统和JVM配置也能工作。

2008-12-12 05:36:04

我认为比设置平台的默认字符集更好的方法是调用更安全的String.getBytes("charsetName")，尤其是当您似乎对影响应用程序部署有限制时，更不用说影响平台了。这样，您的应用程序就不会依赖于超出其控制范围的东西。

我个人认为应该弃用String.getBytes()，因为它在我见过的许多情况下都造成了严重的问题，在这些情况下，开发人员没有考虑到默认字符集可能发生的变化。

2008-12-12 05:39:49

我正在使用Amazon (AWS) Elastic Beanstalk，并成功地将其更改为UTF-8。

在Elastic Beanstalk中，进入配置>软件，“环境属性”。添加(name) JAVA_TOOL_OPTIONS和(value) -Dfile.encoding=UTF8

保存后，环境将以UTF-8编码重新启动。

2018-04-24 08:59:03

不幸的是，文件。encoding属性必须在JVM启动时指定;当输入主方法时，String.getBytes()使用的字符编码和InputStreamReader和OutputStreamWriter的默认构造函数已经被永久缓存。

正如Edward Grech所指出的，在这种特殊情况下，可以使用环境变量JAVA_TOOL_OPTIONS来指定此属性，但通常是这样做的:

java -Dfile.encoding=UTF-8 … com.x.Main

Charset.defaultCharset()将反映对文件的更改。但是核心Java库中需要确定默认字符编码的大多数代码都不使用这种机制。

当您正在编码或解码时，您可以查询文件。属性或Charset.defaultCharset()来查找当前的默认编码，并使用适当的方法或构造函数重载来指定它。

2008-12-12 05:56:25

我已经尝试了很多方法，但是这里的示例代码非常完美。链接

代码的关键是:

String s = "एक गाव में एक किसान";
String out = new String(s.getBytes("UTF-8"), "ISO-8859-1");

2014-07-03 09:33:04

设置默认的Java字符编码

推荐文章

最新文章

标签