从字符串中提取主机名

我想匹配的只是一个URL的根，而不是一个文本字符串的整个URL。考虑到:

http://www.youtube.com/watch?v=ClkQA2Lb_iE
http://youtu.be/ClkQA2Lb_iE
http://www.example.com/12xy45
http://example.com/random

我想让最后2个实例解析到www.example.com或example.com域。

我听说正则表达式很慢，这将是我在页面上的第二个正则表达式，所以如果有办法做到没有正则表达式，请告诉我。

我正在寻找这个解决方案的JS/jQuery版本。

当前回答

解析URL可能很棘手，因为您可以使用端口号和特殊字符。因此，我建议使用parseUri之类的东西来做这个。我怀疑性能不会成为问题，除非您要解析数百个url。

2011-12-14 01:43:50

其他回答

2011-12-14 01:43:50

// use this if you know you have a subdomain
// www.domain.com -> domain.com
function getDomain() {
  return window.location.hostname.replace(/([a-zA-Z0-9]+.)/,"");
}

2012-05-01 05:19:52

jquery Oneline

$('<a>').attr('href', document.location.href).prop('hostname');

2018-05-16 09:43:53

我给你3个可能的解决方案:

使用npm包psl提取你扔给它的任何东西。使用我的自定义实现extractRootDomain，它适用于大多数情况。网址(URL)。主机名是可行的，但并非适用于所有边缘情况。点击“运行代码段”查看它是如何运行的。

1. 使用npm包psl(公共后缀列表)

“公共后缀列表”是所有有效域名后缀和规则的列表，不仅是国家代码顶级域名，还包括被视为根域的unicode字符(即www.食狮.公司.cn, b.c.a bebe .jp等)。点击这里阅读更多信息。

Try:

npm install --save psl

然后用我的“extractHostname”实现运行:

let psl = require('psl');
let url = 'http://www.youtube.com/watch?v=ClkQA2Lb_iE';
psl.get(extractHostname(url)); // returns youtube.com

2. extractRootDomain的自定义实现

下面是我的实现，它还针对各种可能的URL输入运行。

无论是否有协议或端口号，您都可以提取域。这是一个非常简化的，非正则表达式的解，所以我认为这可以解决我们在问题中提供的数据集。

3. 网址(URL) hostname

网址(URL)。主机名是一个有效的解决方案，但它不适用于我已经解决的一些边缘情况。正如您在上次测试中看到的，它不喜欢某些url。你绝对可以使用我的解决方案的组合来让它全部工作。

*感谢@Timmerz， @renoirb， @rineez， @BigDong， @ra00l， @ILikeBeansTacos， @CharlesRobertson的建议!@ross-allen，谢谢你报告这个bug!

2014-05-30 00:06:20

简单来说，你可以这样做

var url = "http://www.someurl.com/support/feature"

function getDomain(url){
  domain=url.split("//")[1];
  return domain.split("/")[0];
}
eg:
  getDomain("http://www.example.com/page/1")

  output:
   "www.example.com"

使用上述函数获取域名

2016-05-17 13:39:27

从字符串中提取主机名

推荐文章

最新文章

标签