我注意到

HTTP://STACKOVERFLOW.COM/QUESTIONS/ASK

and

http://stackoverflow.com/questions/ask

两者都可以工作-实际上前一个转换为小写字母。

我认为这对用户来说是有意义的。

如果我看谷歌,那么这个URL工作正常:

http://www.google.com/intl/en/about/corporate/index.html  

但是这个带ABOUT的不能用:

http://www.google.com/intl/en/ABOUT/corporate/index.html   

URL是否应该区分大小写?


当前回答

RFC 3986第6.2.2.1节说:“scheme和host不区分大小写,因此应该规范化为小写。例如,URI HTTP://www.EXAMPLE.com/等价于http://www.example.com/。假定其他通用语法组件是区分大小写的,除非该方案另有特别定义”。

服务器可以在内部规范化传递的URI,并为不同大小写的URI (/about/和/about/)提供相同的资源,使URI对用户来说不区分大小写。

其他回答

考虑以下几点:

https://www.example.com/createuser.php?name=Paul%20McCartney

在这个假设的示例中,HTML表单(使用GET方法)将“name”参数发送给创建新用户帐户的PHP脚本。

我在这个例子中要强调的一点是,这个GET参数需要区分大小写,以保留“McCartney”的大写字母(或者,作为另一个例子,保留“Walter d’isney”,因为还有其他方法可以打破通常的大写字母规则)。

正是这样的情况指导了W3C的建议,即方案和主机不区分大小写,但之后的所有内容都可能区分大小写——这取决于服务器。通过标准强制不区分大小写将使上面的示例无法保留作为GET查询参数传递的用户输入的大小写。

但我想说的是,尽管这是法律条文中对此类案件的规定,但法律的精神是,在与案件无关的情况下,不区分案件。然而,这些标准并不能告诉你什么情况下大小写无关紧要,因为,就像我给出的例子一样,这是一个与上下文相关的东西。

(例如,帐户用户名最好不区分大小写,因为“User123”和“User123”是不同的帐户,可能会令人混淆,即使他们的真实姓名,如上所示,最好是左区分大小写。)

有时是相关的,大多数时候不是。但这必须由服务器/ web开发人员来决定这些事情——不能由标准规定——因为只有在这个级别上才能知道上下文。

方案和主机是不区分大小写的(这显示了标准对不区分大小写的偏好,在这里它可以被普遍规定)。其余的由您自己决定,因为您更好地理解了上下文。但是,正如已经讨论过的,根据法律的精神,您可能应该默认不区分大小写,除非您有很好的理由不这样做。

一般来说,url的大小写敏感性(以及它们在不同大小写下是否相同)需要从以下角度来看待:

资源等效 URL的比较

从资源等价的角度来看,通常不可能说两个url在任何情况下都不同(小写,大写,句子大小写,驼峰大小写……)大小写的任何组合)彼此不同,除非资源是从两个url中检索的,这在许多情况下是不现实的(RFC 3986, section 6.1, para 1)。因此,当资源不能检索时,使用比较透视图。

然而,在可以检索资源的情况下,问题会变得更加复杂(正如预期的那样)。根据RFC 3986第3.3节第5段的规定,如下所强调的

除了层次路径中的点段之外,路径段是 泛型语法认为是不透明的

似乎不能从通用语法(包括敏感性问题)对URI/URL的方案和权限以外的其他部分做出任何假设。

然而,对于授权的方案和主机部分,规范(仁慈地)规定它们是不区分大小写的。请参阅RFC 3986第3.1节第1段和RFC 3986第6.2.2.1节第2段。

在穷尽了这条查询线之后,应该查看比较透视图,以确定URI/ url是否区分大小写。

对这个方向的第一个提示是通过阅读6.2.2.1节(上面)

另一个泛型语法 除非特别说明,否则假定组件是区分大小写的 由方案另行定义

RFC 2616第3.2.3节进一步支持了这一点

当比较两个uri以决定它们是否匹配时,客户机 是否应该使用区分大小写的八个字节对整个代码进行比较 uri

然后,最后,查询是否已解决,url是否区分大小写…(嘿!),不完全是,关键的词是“opaque”,“client”和“comparison”。

除了它的语法之外,上面的RFC没有提到任何关于路径和查询的实际解释,除了它是“不透明的”,它只指定了“客户端”如何(使用SHOULD而不是MUST)“比较”URL。它没有提到服务器(应该,更不用说必须)如何在方案/权限之外解释URL的其余部分。

因此,服务器有所有的纬度来解释一个URL,因为他们所做的是由其他人之前的帖子突出显示的。

为了可读性,所有“不敏感”都加粗。

根据RFC 4343,域名不区分大小写。URL的其余部分通过GET方法发送到服务器。这可能区分大小写。

以这个页面为例,stackoverflow.com接收GET字符串/questions/7996919/should-url-be-大小写敏感,向浏览器发送HTML文档。Stackoverflow.com是大小写不敏感的,因为它为/QUEStions/7996919/ should -url-be大小写敏感生成了相同的结果。

另一方面,维基百科是区分大小写的,除了标题的第一个字符。url https://en.wikipedia.org/wiki/Case_sensitivity和https://en.wikipedia.org/wiki/case_sensitivity指向同一篇文章,但https://en.wikipedia.org/wiki/CASE_SENSITIVITY返回404。

根据W3的“HTML和url”,它们应该:

可能有url,或者url的一部分,大小写不重要,但是 识别这些可能并不容易。用户应该始终考虑到这一点 url区分大小写。

取决于主机操作系统。托管在Windows上的站点往往不区分大小写,因为底层文件系统不区分大小写。托管在Unix类型系统上的站点往往是区分大小写的,因为它们的底层文件系统通常是区分大小写的。URL的主机名部分总是不区分大小写的,路径的其余部分是不同的。