如何正确地设置JVM (1.5.x)使用的默认字符编码?

我读过-Dfile。encoding=任何以前的jvm使用的方式。我没有那种奢侈,原因我就不多说了。

我试过:

System.setProperty("file.encoding", "UTF-8");

并且属性被设置了,但是它似乎没有导致下面最后的getBytes调用使用UTF8:

System.setProperty("file.encoding", "UTF-8");

byte inbytes[] = new byte[1024];

FileInputStream fis = new FileInputStream("response.txt");
fis.read(inbytes);
FileOutputStream fos = new FileOutputStream("response-2.txt");
String in = new String(inbytes, "UTF8");
fos.write(in.getBytes());

当前回答

试试这个:

    new OutputStreamWriter( new FileOutputStream("Your_file_fullpath" ),Charset.forName("UTF8"))

其他回答

在启动应用程序时设置jvm参数帮助我解决了这个问题。java -Dfile。编码= utf - 8 -Dsun.jnu.encoding = utf - 8。

文件。encoding=UTF-8 -这有助于在文件中使用Unicode字符。

sun.jnu。encoding=UTF-8 -这有助于在文件系统中使用Unicode字符作为文件名。

从JVM™工具接口文档…

由于不能总是访问或修改命令行,例如在嵌入式vm中或只是在脚本深处启动的vm中,因此提供了一个JAVA_TOOL_OPTIONS变量,以便在这些情况下可以启动代理。

通过将(Windows)环境变量JAVA_TOOL_OPTIONS设置为-Dfile。encoding=UTF8, (Java) System属性将在每次JVM启动时自动设置。您将知道参数已被拾取,因为下面的消息将被发布到System.err:

选择JAVA_TOOL_OPTIONS: -Dfile.encoding=UTF8

我认为比设置平台的默认字符集更好的方法是调用更安全的String.getBytes("charsetName"),尤其是当您似乎对影响应用程序部署有限制时,更不用说影响平台了。这样,您的应用程序就不会依赖于超出其控制范围的东西。

我个人认为应该弃用String.getBytes(),因为它在我见过的许多情况下都造成了严重的问题,在这些情况下,开发人员没有考虑到默认字符集可能发生的变化。

我已经尝试了很多方法,但是这里的示例代码非常完美。 链接

代码的关键是:

String s = "एक गाव में एक किसान";
String out = new String(s.getBytes("UTF-8"), "ISO-8859-1");

我们有同样的问题。我们系统地尝试了本文(和其他文章)中的一些建议,但都无济于事。我们还尝试了添加-Dfile。encoding=UTF8和似乎没有工作。

对于遇到此问题的人,下面的文章最终帮助我们了解了区域设置如何破坏Java/Tomcat中的unicode/UTF-8

http://www.jvmhost.com/articles/locale-breaks-unicode-utf-8-java-tomcat

在~/. conf中正确设置区域设置。Bashrc文件为我们工作。