子域(域名)可以有下划线_吗?


当前回答

不管主机名和域名的讨论如何,在url的主机部分使用下划线肯定是一个非常糟糕的主意。它会给你带来悲伤。它可能在浏览器中很好地工作,但在最近的一个案例中,我遇到了一个应用程序拒绝使用*.s3的完全有效的通配符证书建立tls连接。Amazonaws.com,因为通配符主机名部分有一个下划线,并且不生效。我相信底层库使用了openssl。

其他回答

我参考了RFC1034的链接,阅读了大部分内容,并惊讶地看到了这个:

标签必须遵循ARPANET主机名规则。他们必须 以字母开头,以字母或数字结尾,内部相同 只能使用字母、数字和连字符。还有一些 长度限制。标签必须小于等于63个字符。

为了说明,域名由标签组成,标签之间用点“。”隔开。这个规范肯定过时了,因为它没有提到下划线的使用。如果有人在不知道这个规范已经过时的情况下偶然发现它,我可以理解这种困惑。它已经过时了,不是吗?

我参考了RFC2181的链接并阅读了其中的一些内容。特别是当它涉及到什么是权威或规范名称的问题,以及什么是有效的DNS标签的问题时。

正如之前发布的那样,它只限制了长度,然后总结起来是这样的:

(关于名称和有效标签)

这些已经被充分地指定了,但是这些规范有时似乎被忽略了。我们寻求加强现有的规范。

有点让我怀疑“只限制长度”是否“足够”。我们会开始看到像@#$%这样的域名吗!!很快吗?难道互联网还不够糟糕吗?

澄清bortzmeyer和David Tonhofer,域名和子域名标签可以包含前导下划线,但没有其他地方。

如David Tonhofer所述,标签是介于句号之间的部分,除了指定服务标签和端口标签以区别于普通标签外,其他部分都应遵循LDH规则。然后,它们必须出现在标签的开头,标签应该是来自服务名称和端口号注册表的“短名称”,端口号不带前导0,或者协议(即。tcp, udp)。这些服务标签进一步限制为15个字符。

RFC2782指定前缀 带下划线的服务记录子域。 RFC6698指定前缀 TLSA证书记录中带下划线的端口号。

与David Tonhofer的回答相反,IDN不允许编码下划线('_' U+005F LOW LINE)或任何其他无效的ASCII字符。

从RFC5890

(. .]两个新的LDH标签子集由 介绍IDNA。这些被称为保留LDH标签(R-LDH 非保留LDH标签(NR-LDH标签)。保留LDH 标签,在其他一些情况下被称为“带标签的域名”,具有 它们在第三和第四个中包含“——”的属性 其他符合LDH标记规则的字符。

Punycode将所有ASCII码点直接编码为ASCII,包括下划线。生成的R-LDH不符合LDH标签规则。例如,Σ_.com将被编码为xn——_-zmb.com,这违反了规则。可能会有一个单应码点,看起来像一个下划线,可以合法编码(可能是'_' U+FF3F fullwidth low line),但这些类型的码点将被RFC5892在2.3 IgnorableProperties中归类为不允许的非character_code_point。

RACE(另一个提议的IDN编码方案)没有被IETF接受为标准,不应该被使用。

截至2022年,谷歌搜索中出现了子域名包含下划线的网站。

关于术语的注释,有助于Bortzmeyer的回答

人们应该清楚定义。在这里使用:

域名是DNS数据库中资源的标识符 标签是域名中点与点之间的部分 主机名是一种特殊类型的域名,用于标识Internet主机

主机名受RFC 952和RFC 1123的限制

RFC 2181明确了域名和主机名之间的区别:

...任何二进制标签都可以有MX记录这一事实并不意味着任何二进制名称都可以用作电子邮件地址的主机部分……

所以主机名中的下划线是不可以的,域名中的下划线是可以的。

在实践中,很可能会看到带有下划线的主机名。正如稳健性原则(robust Principle)所言:“送出的东西要保守,接受的东西要自由。”

关于编码的说明

在21世纪,事实证明,主机名和域名都可能国际化!这意味着在标签包含允许集合之外的字符的情况下求助于编码。

特别是,它允许在主机名中编码_(更新2017-07:这是可疑的,见评论。“_”仍然不能用于主机名。事实上,它甚至不能用于国际化的标签。)

第一个国际化的RFC是2003年3月的RFC 3490,“国际化应用程序中的域名(IDNA)”。今天,我们有:

RFC 5890“IDNA:定义和文档框架” RFC 5891“IDNA:协议” RFC 5892“统一码位和IDNA” RFC 5893“IDNA的从右向左脚本” RFC 5894《IDNA:背景、解释和基本原理》 RFC 5895“IDNA 2008的映射字符”

你可能还想查看维基百科词条

RFC 5890为主机名中使用的标签引入了术语LDH(字母-数字-连字符)标签,并表示:

这是在主机名中使用的经典标签形式,尽管有一些额外的限制(RFC 952)。它的语法与RFC 1123修改的RFC 1034章节3.5中描述的“首选名称语法”相同。简单地说,它是一个由ASCII字母、数字和连字符组成的字符串,进一步的限制是连字符不能出现在字符串的开头或结尾。与所有DNS标签一样,它的总长度不能超过63个字节。

回到更简单的时代,这个Internet草案是主机名国际化的早期建议。带有国际字符的主机名可以使用,例如,'RACE'编码进行编码。

“RACE编码”提案的作者指出:

According to RFC 1035, host parts must be case-insensitive, start and end with a letter or digit, and contain only letters, digits, and the hyphen character ("-"). This, of course, excludes any internationalized characters, as well as many other characters in the ASCII character repertoire. Further, domain name parts must be 63 octets or shorter in length.... All post-converted name parts that contain internationalized characters begin with the string "bq--". (...) The string "bq--" was chosen because it is extremely unlikely to exist in host parts before this specification was produced.

最近cab论坛(*)决定

在任何dNSName条目中包含下划线字符且有效期超过30天的所有证书必须在2019年1月15日之前撤销。https://cabforum.org/2018/11/12/ballot-sc-12-sunset-of-underscores-in-dnsnames/

这意味着您将不再允许在具有ssl/tls证书的域中使用下划线。

(*)证书颁发机构浏览器论坛(CA/浏览器论坛)是主要证书颁发者(定义见下文2.1(a)(1)和(2)节)和互联网浏览器软件和其他使用证书的应用程序供应商(定义见下文2.1(a)(3)节)的自愿聚会。