HTTP URL地址编码在Java

我的Java独立应用程序从用户那里获得一个URL(指向一个文件)，我需要点击它并下载它。我面临的问题是，我不能正确编码HTTP URL地址…

例子:

URL:  http://search.barnesandnoble.com/booksearch/first book.pdf

java.net.URLEncoder.encode(url.toString(), "ISO-8859-1");

回报我。

http%3A%2F%2Fsearch.barnesandnoble.com%2Fbooksearch%2Ffirst+book.pdf

但是，我想要的是

http://search.barnesandnoble.com/booksearch/first%20book.pdf

(空格替换为%20)

我猜URLEncoder不是为编码HTTP url设计的…JavaDoc说“HTML表单编码的实用程序类”…还有别的办法吗?

当前回答

如果你有一个URL，你可以将URL . tostring()传递给这个方法。首先解码，以避免双重编码(例如，编码空格会得到%20，编码百分号会得到%25，因此双重编码将把空格变成%2520)。然后，像上面解释的那样使用URI，添加URL的所有部分(这样就不会删除查询参数)。

public URL convertToURLEscapingIllegalCharacters(String string){
    try {
        String decodedURL = URLDecoder.decode(string, "UTF-8");
        URL url = new URL(decodedURL);
        URI uri = new URI(url.getProtocol(), url.getUserInfo(), url.getHost(), url.getPort(), url.getPath(), url.getQuery(), url.getRef()); 
        return uri.toURL(); 
    } catch (Exception ex) {
        ex.printStackTrace();
        return null;
    }
}

2012-03-03 02:12:46

其他回答

URL编码会对那个字符串进行编码这样它就能在URL中正确地传递到最终目的地。例如，您不能使用http://stackoverflow.com?url=http://yyy.com。UrlEncoding参数将修复该参数值。

所以我给你两个选择:

您是否有权访问与域分离的路径?如果是这样，您可以简单地对路径进行UrlEncode。然而，如果情况并非如此，那么选择2可能适合你。 commons - httpclient 3.1。它有一个类URIUtil: System.out.println(URIUtil.encodePath("http://example.com/x y"， "ISO-8859-1"));

这将输出您正在寻找的内容，因为它只对URI的路径部分进行编码。

供您参考，这个方法需要common -codec和common -logging才能在运行时工作。

2009-04-07 03:34:45

使用以下标准Java解决方案(通过Web平台测试提供的大约100个测试用例):

0. 测试URL是否已经编码。

1. 将URL拆分为结构部分。使用java.net.URL。

2. 正确编码每个结构部分!

3.使用IDN.toASCII(putDomainNameHere)对主机名进行Punycode编码!

4. 使用java.net.URI.toASCIIString()进行百分比编码，NFC编码的unicode -(更好的是NFKC!)

更多信息请访问:https://stackoverflow.com/a/49796882/1485527

2018-04-12 13:07:40

在此我将针对Android用户添加一条建议。您可以这样做，从而避免获得任何外部库。此外，上面一些答案中建议的所有搜索/替换字符解决方案都是危险的，应该避免。

试一试:

String urlStr = "http://abc.dev.domain.com/0007AC/ads/800x480 15sec h.264.mp4";
URL url = new URL(urlStr);
URI uri = new URI(url.getProtocol(), url.getUserInfo(), url.getHost(), url.getPort(), url.getPath(), url.getQuery(), url.getRef());
url = uri.toURL();

您可以看到，在这个特定的URL中，我需要对这些空格进行编码，以便我可以将其用于请求。

这利用了Android类中提供给你的几个功能。首先，URL类可以将URL分解为适当的组件，因此不需要进行任何字符串搜索/替换工作。其次，当您通过组件而不是从单个字符串构造URI时，这种方法利用了正确转义组件的URI类特性。

这种方法的美妙之处在于，您可以使用任何有效的url字符串并让它工作，而不需要您自己对它有任何特殊的了解。

2012-01-22 17:04:01

我也有同样的问题。通过unsing解决了这个问题:

android.net.Uri.encode(urlString, ":/");

它对字符串进行编码，但跳过“:”和“/”。

2017-04-03 09:55:32

我阅读了以前的答案，写我自己的方法，因为我不能有一些正确的工作使用以前的答案的解决方案，它看起来对我很好，但如果你能找到不与此工作的URL，请让我知道。

public static URL convertToURLEscapingIllegalCharacters(String toEscape) throws MalformedURLException, URISyntaxException {
            URL url = new URL(toEscape);
            URI uri = new URI(url.getProtocol(), url.getUserInfo(), url.getHost(), url.getPort(), url.getPath(), url.getQuery(), url.getRef());
            //if a % is included in the toEscape string, it will be re-encoded to %25 and we don't want re-encoding, just encoding
            return new URL(uri.toString().replace("%25", "%"));
}

2015-06-04 10:02:20

HTTP URL地址编码在Java

推荐文章

最新文章

标签