有没有一种方法可以实现以下返回?
string title = "ASTRINGTOTEST";
title.Contains("string");
似乎没有一个过载允许我设置大小写敏感度。目前,我对这两个问题都有夸大的感觉,但这太傻了(我指的是大小写中的i18n问题)。
更新
这是一个古老的问题,从那时起,我意识到,如果你愿意充分调查,我要求一个非常广泛和困难的问题的简单答案。
对于大多数情况,在单语言、英语代码基础上,这个答案就足够了。我怀疑,因为大多数来这里的人都属于这一类,这是最流行的答案。
然而,这个答案带来了一个固有的问题,即在我们知道两个文本都是相同的文化并且我们知道文化是什么之前,我们不能比较文本不区分大小写。这可能是一个不太流行的答案,但我认为它更正确,这就是我将其标记为这样的原因。
如果您担心国际化(或者您可以重新实现它),VisualBasic程序集的InStr方法是最好的。看看dotNeetWeek,它不仅说明了大写字母和小写字母,还说明了假名类型和全半角字符(大多数与亚洲语言相关,尽管罗马字母表也有全半角版本)。我跳过了一些细节,但请查看私有方法InternalInStrText:
private static int InternalInStrText(int lStartPos, string sSrc, string sFind)
{
int num = sSrc == null ? 0 : sSrc.Length;
if (lStartPos > num || num == 0)
return -1;
if (sFind == null || sFind.Length == 0)
return lStartPos;
else
return Utils.GetCultureInfo().CompareInfo.IndexOf(sSrc, sFind, lStartPos, CompareOptions.IgnoreCase | CompareOptions.IgnoreKanaType | CompareOptions.IgnoreWidth);
}
排名靠前的几个答案都是正确的,我在这里补充了更多信息、背景和观点。
为了清楚起见,让我们考虑字符串A包含字符串B,如果A中有任何等于B的代码点子序列。如果我们接受这一点,问题就归结为两个字符串是否相等的问题。
字符串何时相等的问题已经被详细考虑了几十年。当前知识的大部分状态都封装在SQL排序规则中。Unicode正规形式接近于这一类型的适当子集。但是,除了SQL排序之外,还有更多的内容。
例如,在SQL排序规则中,可以
严格区分二进制-因此不同的Unicode规范化形式(例如预组合或组合重音)的比较不同。例如,é可以表示为U+00e9(预组合)或U+0065 U+0301(e带组合锐音符)。这些相同还是不同?Unicode规范化-在这种情况下,上述示例将彼此相等,但不等于É或e。不区分重音,(例如西班牙语、德语、瑞典语等文本)。在这种情况下,U+0065=U+0065 U+0301=U+00e9=é=e不区分大小写和重音,因此(例如西班牙语、德语、瑞典语等文本)。在这种情况下,U+00e9=U+0065 U+0301=U+000c9=U+0.045 U+0301=U+0049=U+0065=E=E=É=é假名类型敏感或不敏感,即您可以将日语平假名和片假名视为等同或不同。这两个音节包含相同数量的字符,组织和发音方式(大部分)相同,但书写方式不同,用途不同。例如,片假名用于外来词或外国名字,而平假名用于儿童读物、发音指南(例如rubies),以及单词没有汉字的地方(或者作者不知道汉字,或者认为读者可能不知道)。全宽或半宽敏感-由于历史原因,日语编码包括一些字符的两种表示形式-它们以不同的大小显示。配体是否等效:参见https://en.wikipedia.org/wiki/Ligature_(书面)æ是否与ae相同?它们有不同的Unicode编码,重音字符也是如此,但与重音字符不同,它们看起来也不同。这让我们想到。。。阿拉伯语表示形式等效阿拉伯书写有一种优美的书法文化,其中相邻字母的特定序列有特定的表示。其中许多都是用Unicode标准编码的。我不完全理解这些规则,但在我看来,它们类似于连字。其他文字和系统:我对卡纳达语、马拉雅拉姆语、僧伽罗语、泰语、古吉拉特语、藏语或几乎所有未提及的数十种或数百种文字一无所知。我假设他们对程序员也有类似的问题,考虑到目前为止提到的问题数量和脚本数量,他们可能也有程序员应该考虑的其他问题。
这让我们摆脱了“编码”杂草。
现在我们必须输入“含义”杂草。
北京等于吗北京? 如果不是,Bĕijīng是否等于北京? 如果没有,为什么不呢?这是拼音罗马化。北京等于吗北京? 如果没有,为什么不呢?这是韦德·吉尔斯的罗马化。北京等于北京吗?如果没有,为什么不呢?
你为什么要这么做?
例如,如果您想知道两个字符串(A和B)是否可能指向同一地理位置或同一个人,您可能想问:
这些字符串是Wade Giles还是一组汉字序列的拼音表示?如果是,对应的集合之间是否有重叠?这些字符串中是否有一个是汉字的西里尔字母?这些字符串中有一个是拼音罗马化的西里尔音译吗?这些字符串中是否有一个是英文名称汉语化的拼音罗马化的西里尔文音译?
很明显,这些问题很难回答,没有明确的答案,而且在任何情况下,答案可能会根据问题的目的而有所不同。
以一个具体的例子结束。
如果您正在递送信件或包裹,请明确注明北京、北京、北京和北京 都是相等的。出于这个目的,它们都是同样好的。毫无疑问,中国邮政局承认许多其他选择,如法语的Pékin、葡萄牙语的Pequim、Bắ越南语为c Kinh,蒙古语为Бээжин。
单词没有固定的含义。
语言是我们用来导航世界、完成任务以及与他人交流的工具。
虽然看起来,如果平等、北京或意义等词有固定的含义会有所帮助,但可悲的是,它们没有固定的含义。
然而,我们似乎不知怎么混过去了。
TL;DR:如果你正在处理与现实相关的问题,在所有的模糊性(模糊、不确定性、缺乏清晰的边界)中,每个问题基本上有三种可能的答案:
可能可能不会大概