如何用链接替换普通url ?

我正在使用下面的函数来匹配给定文本中的url，并将它们替换为HTML链接。正则表达式工作得很好，但目前我只替换了第一个匹配。

我怎么能替换所有的URL?我想我应该使用exec命令，但我真的不知道如何做到这一点。

function replaceURLWithHTMLLinks(text) {
    var exp = /(\b(https?|ftp|file):\/\/[-A-Z0-9+&@#\/%?=~_|!:,.;]*[-A-Z0-9+&@#\/%=~_|])/i;
    return text.replace(exp,"<a href='$1'>$1</a>"); 
}

当前回答

首先，滚动自己的regexp来解析url是一个糟糕的想法。您必须想象这是一个足够常见的问题，根据rfc，有人已经为它编写、调试和测试了一个库。URI是复杂的——查看Node.js中URL解析的代码和关于URI方案的维基百科页面。

在解析URL时，有大量的边缘情况:国际域名，实际的(.museum)和不存在的(.etc)顶级域名，奇怪的标点符号(包括括号)，URL末尾的标点符号，IPV6主机名等。

我已经查看了大量的库，尽管有一些缺点，但还是有一些值得使用:

Soapbox的linkify已经投入了大量精力，2015年6月的一次重大重构删除了jQuery依赖项。它仍然存在idn问题。 AnchorMe是一个自称更快更精简的新产品。还有一些IDN问题。 Autolinker.js列出了非常具体的特性(例如:将正确处理HTML输入。该实用程序不会改变anchor()标签内的href属性”)。当演示版本可用时，我将对其进行一些测试。

我很快就取消了这个任务的库:

Django的urlize不能正确处理某些tld(以下是官方列出的有效tld)。没有演示。 autolink-js不会检测“www.google.com”没有http://，，所以它不太适合自动链接“随意的url”(没有方案/协议)在纯文本中找到。本·阿尔曼的链接自2009年以来就没有维护过。

如果坚持使用正则表达式，最全面的是Component中的URL regexp，尽管它会错误地检测到一些不存在的双字母tld。

2014-02-21 04:46:07

其他回答

以下是我的解决方案:

var content = "Visit https://wwww.google.com or watch this video: https://www.youtube.com/watch?v=0T4DQYgsazo and news at http://www.bbc.com";
content = replaceUrlsWithLinks(content, "http://");
content = replaceUrlsWithLinks(content, "https://");

function replaceUrlsWithLinks(content, protocol) {
    var startPos = 0;
    var s = 0;

    while (s < content.length) {
        startPos = content.indexOf(protocol, s);

        if (startPos < 0)
            return content;

        let endPos = content.indexOf(" ", startPos + 1);

        if (endPos < 0)
            endPos = content.length;

        let url = content.substr(startPos, endPos - startPos);

        if (url.endsWith(".") || url.endsWith("?") || url.endsWith(",")) {
            url = url.substr(0, url.length - 1);
            endPos--;
        }

        if (ROOTNS.utils.stringsHelper.validUrl(url)) {
            let link = "<a href='" + url + "'>" + url + "</a>";
            content = content.substr(0, startPos) + link + content.substr(endPos);
            s = startPos + link.length;
        } else {
            s = endPos + 1;
        }
    }

    return content;
}

function validUrl(url) {
    try {
        new URL(url);
        return true;
    } catch (e) {
        return false;
    }
}

2018-07-24 13:29:33

这样做的最佳脚本: http://benalman.com/projects/javascript-linkify-process-lin/

2010-06-25 05:18:20

/**
 * Convert URLs in a string to anchor buttons
 * @param {!string} string
 * @returns {!string}
 */

function URLify(string){
  var urls = string.match(/(((ftp|https?):\/\/)[\-\w@:%_\+.~#?,&\/\/=]+)/g);
  if (urls) {
    urls.forEach(function (url) {
      string = string.replace(url, '<a target="_blank" href="' + url + '">' + url + "</a>");
    });
  }
  return string.replace("(", "<br/>(");
}

简单的例子

2019-04-08 14:21:10

用链接替换url(一般问题的答案)

问题中的正则表达式漏掉了很多边缘情况。在检测URL时，最好使用专门的库来处理国际域名、新顶级域名(如.museum)、括号和URL内部和末尾的其他标点符号，以及许多其他边缘情况。有关其他问题的解释，请参阅Jeff Atwood的博客文章the Problem With url。

Dan Dascalescu的回答是URL匹配库的最佳总结 (截至2014年2月)

“使正则表达式替换多个匹配”(具体问题的回答)

在正则表达式的末尾添加一个“g”来启用全局匹配: