设置默认的Java字符编码

如何正确地设置JVM (1.5.x)使用的默认字符编码?

我读过-Dfile。encoding=任何以前的jvm使用的方式。我没有那种奢侈，原因我就不多说了。

我试过:

System.setProperty("file.encoding", "UTF-8");

并且属性被设置了，但是它似乎没有导致下面最后的getBytes调用使用UTF8:

System.setProperty("file.encoding", "UTF-8");

byte inbytes[] = new byte[1024];

FileInputStream fis = new FileInputStream("response.txt");
fis.read(inbytes);
FileOutputStream fos = new FileOutputStream("response-2.txt");
String in = new String(inbytes, "UTF8");
fos.write(in.getBytes());

我不能回答你最初的问题，但我想给你一些建议——不要依赖JVM的默认编码。最好显式地指定所需的编码(例如:"UTF-8")。这样，您就知道它即使跨不同的系统和JVM配置也能工作。

2008-12-12 05:36:04

我认为比设置平台的默认字符集更好的方法是调用更安全的String.getBytes("charsetName")，尤其是当您似乎对影响应用程序部署有限制时，更不用说影响平台了。这样，您的应用程序就不会依赖于超出其控制范围的东西。

我个人认为应该弃用String.getBytes()，因为它在我见过的许多情况下都造成了严重的问题，在这些情况下，开发人员没有考虑到默认字符集可能发生的变化。

2008-12-12 05:39:49

不幸的是，文件。encoding属性必须在JVM启动时指定;当输入主方法时，String.getBytes()使用的字符编码和InputStreamReader和OutputStreamWriter的默认构造函数已经被永久缓存。

正如Edward Grech所指出的，在这种特殊情况下，可以使用环境变量JAVA_TOOL_OPTIONS来指定此属性，但通常是这样做的:

java -Dfile.encoding=UTF-8 … com.x.Main

Charset.defaultCharset()将反映对文件的更改。但是核心Java库中需要确定默认字符编码的大多数代码都不使用这种机制。

当您正在编码或解码时，您可以查询文件。属性或Charset.defaultCharset()来查找当前的默认编码，并使用适当的方法或构造函数重载来指定它。

2008-12-12 05:56:25

不清楚在这一点上你能做什么，不能控制什么。如果可以在目标文件上插入不同的OutputStream类，则可以使用OutputStream的子类型，它将字符串转换为您定义的字符集下的字节，默认情况下是UTF-8。如果修改的UTF-8足够满足你的需要，你可以使用DataOutputStream.writeUTF(String):

byte inbytes[] = new byte[1024];
FileInputStream fis = new FileInputStream("response.txt");
fis.read(inbytes);
String in = new String(inbytes, "UTF8");
DataOutputStream out = new DataOutputStream(new FileOutputStream("response-2.txt"));
out.writeUTF(in); // no getBytes() here

如果这种方法不可行，那么在这里阐明在数据流和执行环境方面哪些可以控制，哪些不能控制，可能会有所帮助(尽管我知道有时说起来容易做起来难)。祝你好运。

2008-12-16 03:59:32

从JVM™工具接口文档…

由于不能总是访问或修改命令行，例如在嵌入式vm中或只是在脚本深处启动的vm中，因此提供了一个JAVA_TOOL_OPTIONS变量，以便在这些情况下可以启动代理。

通过将(Windows)环境变量JAVA_TOOL_OPTIONS设置为-Dfile。encoding=UTF8， (Java) System属性将在每次JVM启动时自动设置。您将知道参数已被拾取，因为下面的消息将被发布到System.err:

选择JAVA_TOOL_OPTIONS: -Dfile.encoding=UTF8

2009-03-08 04:31:50

我们把这两个系统属性放在一起，它让系统把所有东西都变成utf8

file.encoding=UTF8
client.encoding.override＝UTF-8

2012-01-19 19:23:40

试试这个:

    new OutputStreamWriter( new FileOutputStream("Your_file_fullpath" ),Charset.forName("UTF8"))

2012-01-20 18:09:42

我有一个非常有效的方法!!

System.setProperty("file.encoding","UTF-8");
Field charset = Charset.class.getDeclaredField("defaultCharset");
charset.setAccessible(true);
charset.set(null,null);

通过这种方式，您将欺骗JVM，它会认为字符集没有设置，并使它在运行时再次设置为UTF-8 !

2013-02-20 19:09:04

我们有同样的问题。我们系统地尝试了本文(和其他文章)中的一些建议，但都无济于事。我们还尝试了添加-Dfile。encoding=UTF8和似乎没有工作。

对于遇到此问题的人，下面的文章最终帮助我们了解了区域设置如何破坏Java/Tomcat中的unicode/UTF-8

http://www.jvmhost.com/articles/locale-breaks-unicode-utf-8-java-tomcat

在~/. conf中正确设置区域设置。Bashrc文件为我们工作。

2014-01-09 00:46:28

我已经尝试了很多方法，但是这里的示例代码非常完美。链接

代码的关键是:

String s = "एक गाव में एक किसान";
String out = new String(s.getBytes("UTF-8"), "ISO-8859-1");

2014-07-03 09:33:04

按照@Caspar对已接受答案的评论，根据Sun的说法，解决这个问题的首选方法是:

"在启动Java程序之前，更改底层平台的语言环境。"

http://bugs.java.com/view_bug.do?bug_id=4163515

docker参见:

http://jaredmarkell.com/docker-and-locales/

2017-10-05 15:40:32

最近，我偶然接触了一家本地公司的Notes 6.5系统，发现在非中文本地Windows安装系统上，web邮件会显示无法识别的字符。我在网上查了几周，几分钟前才发现:

在Java属性中，将以下字符串添加到Runtime Parameters

-Dfile.encoding=MS950 -Duser.language=zh -Duser.country=TW -Dsun.jnu.encoding=MS950

在这种情况下，UTF-8设置将不起作用。

2017-10-14 17:14:47

如果您正在使用Spring Boot并希望传递参数文件。你必须像这样运行它:

mvn spring-boot:run -Drun.jvmArguments="-Dfile.encoding=UTF-8"

这是我们所需要的，因为我们使用JTwig模板和操作系统有ANSI_X3.4-1968，我们通过system .out.println(system . getproperty ("file.encoding"));

希望这能帮助到一些人!

2018-02-23 17:01:53

mvn clean install -Dfile.encoding=UTF-8 -Dmaven.repo.local=/path-to-m2

命令与exec-maven-plugin一起解决配置Jenkins任务时的以下错误。

Java HotSpot(TM) 64-Bit Server VM warning: ignoring option MaxPermSize=512m; support was removed in 8.0
Error occurred during initialization of VM
java.nio.charset.IllegalCharsetNameException: "UTF-8"
    at java.nio.charset.Charset.checkName(Charset.java:315)
    at java.nio.charset.Charset.lookup2(Charset.java:484)
    at java.nio.charset.Charset.lookup(Charset.java:464)
    at java.nio.charset.Charset.defaultCharset(Charset.java:609)
    at sun.nio.cs.StreamEncoder.forOutputStreamWriter(StreamEncoder.java:56)
    at java.io.OutputStreamWriter.<init>(OutputStreamWriter.java:111)
    at java.io.PrintStream.<init>(PrintStream.java:104)
    at java.io.PrintStream.<init>(PrintStream.java:151)
    at java.lang.System.newPrintStream(System.java:1148)
    at java.lang.System.initializeSystemClass(System.java:1192)

2018-03-06 08:28:28

我正在使用Amazon (AWS) Elastic Beanstalk，并成功地将其更改为UTF-8。

在Elastic Beanstalk中，进入配置>软件，“环境属性”。添加(name) JAVA_TOOL_OPTIONS和(value) -Dfile.encoding=UTF8

保存后，环境将以UTF-8编码重新启动。

2018-04-24 08:59:03

我的团队在装有Windows的机器上遇到了同样的问题。然后用两种方法解决了这个问题:

a)设置环境变量(即使在Windows系统首选项中)

JAVA_TOOL_OPTIONS -Dfile.encoding = UTF8

b)在pom.xml中引入以下片段:

 -Dfile.encoding=UTF-8

在

 <jvmArguments>
 -Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=n,address=8001
 -Dfile.encoding=UTF-8
 </jvmArguments>

2019-07-03 12:58:14

在我的项目中解决这个问题。希望它能帮助到别人。

我使用LIBGDX java框架，也有这个问题在我的android工作室项目。在Mac OS中编码是正确的，但在Windows 10中有特殊字符和符号俄语字符也显示为问题，如:?????以及其他不正确的符号。

更改android studio项目设置: 文件- >设置…>编辑器->文件编码UTF-8在所有三个字段(全局编码，项目编码和默认如下)。在任何java文件集中: System.setProperty(“file.encoding”、“utf - 8”); 对于测试打印调试日志: system . out。println("My project encoding is: "+ Charset.defaultCharset());

2020-08-07 13:52:10

在启动应用程序时设置jvm参数帮助我解决了这个问题。java -Dfile。编码= utf - 8 -Dsun.jnu.encoding = utf - 8。

文件。encoding=UTF-8 -这有助于在文件中使用Unicode字符。

sun.jnu。encoding=UTF-8 -这有助于在文件系统中使用Unicode字符作为文件名。

2021-11-05 06:36:49

设置默认的Java字符编码

推荐文章

最新文章

标签