URLEncoder不能翻译空格字符

我在期待

System.out.println(java.net.URLEncoder.encode("Hello World", "UTF-8"));

输出:

你好%20世界

(20是ASCII十六进制空格码)

然而，我得到的是:

你好+世界

我用错方法了吗?我应该使用的正确方法是什么?

当前回答

Hello+World是浏览器为GET请求编码表单数据(application/x-www-form-urlencoded)的方式，这是URI查询部分的普遍接受的形式。

http://host/path/?message=Hello+World

如果将此请求发送到Java servlet, servlet将正确解码参数值。通常唯一出现问题的情况是编码不匹配。

严格来说，HTTP或URI规范中没有要求使用application/x-www-form- urlenencoded键-值对对查询部分进行编码;查询部分只需采用web服务器接受的形式即可。实际上，这不大可能成为一个问题。

对于URI的其他部分(例如路径)使用这种编码通常是不正确的。在这种情况下，您应该使用RFC 3986中描述的编码方案。

http://host/Hello%20World

更多的在这里。

2011-01-19 17:00:55

其他回答

这是预期的行为。URLEncoder实现了如何在HTML表单中编码url的HTML规范。

来自javadocs:

该类包含的静态方法将String转换为应用程序/ x-www-form-urlencoded MIME 格式。

和来自HTML规范:

应用程序/ x-www-form-urlencoded 使用此内容类型提交的表单必须编码如下: 控件名称和值被转义。空格字符被替换通过“+”

你必须更换它，例如:

System.out.println(java.net.URLEncoder.encode("Hello World", "UTF-8").replace("+", "%20"));

2011-01-19 16:37:12

如果你想编码URI路径组件，你也可以使用标准的JDK函数，例如:

public static String encodeURLPathComponent(String path) {
    try {
        return new URI(null, null, path, null).toASCIIString();
    } catch (URISyntaxException e) {
        // do some error handling
    }
    return "";
}

URI类还可以用于编码URI的不同部分或整个URI。

2021-01-20 07:37:46

URLEncoder使用字符集“ISO-8859-1”

2012-08-09 12:43:40

这对我很有效

org.apache.catalina.util.URLEncoder ul = new org.apache.catalina.util.URLEncoder().encode("MY URL");

2015-08-07 13:34:29