MySQL和PHP的最佳排序规则是什么？

我想知道，对于您不能100%确定将要输入的内容的普通网站，MySQL中是否有“最佳”排序选择？我知道所有的编码应该是相同的，比如MySQL、Apache、HTML和PHP中的任何内容。

在过去，我将PHP设置为以“UTF-8”输出，但这与MySQL中的排序规则匹配？我认为它是UTF-8之一，但我以前使用过utf8_unicode_ci、utf8_general_ci和utf8_bin。

当前回答

公认的答案相当明确地建议使用utf8_unicode_ci，而对于很棒的新项目，我想讲述一下我最近的相反经验，以防节省任何人的时间。

因为utf8_general_ci是MySQL中Unicode的默认排序规则，所以如果您想使用utf8_Unicode_ci，那么您必须在很多地方指定它。

例如，所有客户端连接不仅有一个默认字符集（对我来说有意义），而且还有一个默认排序规则（即，对于unicode，排序规则将始终默认为utf8_general_ci）。

很可能，如果您对字段使用utf8_unicode_ci，则需要更新连接到数据库的脚本，以明确提及所需的排序规则，否则当您的连接使用默认排序规则时，使用文本字符串的查询可能会失败。

结果是，当将任何大小的现有系统转换为Unicode/utf8时，由于MySQL处理默认值的方式，您可能会被迫使用utf8_general_ci。

2013-07-30 13:20:02

其他回答

本质上，这取决于你如何看待字符串。

由于Guus强调的问题，我总是使用utf8_bin。在我看来，就数据库而言，字符串仍然只是一个字符串。字符串是一组UTF-8字符。一个字符有一个二进制表示，所以为什么它需要知道你使用的语言？通常，人们会为多语言站点的系统构建数据库。这就是使用UTF-8作为字符集的全部意义。我是一个有点纯粹的人，但我认为错误风险大大超过了索引可能带来的微小优势。任何与语言相关的规则都应该在比DBMS高得多的级别上执行。

在我的书中，“价值”在一百万年内永远不应该等于“价值”。

如果我想存储文本字段并进行不区分大小写的搜索，我将使用MYSQL字符串函数和PHP函数，如LOWER（）和PHP函数strtolower（）。

2010-12-07 01:42:37

公认的答案相当明确地建议使用utf8_unicode_ci，而对于很棒的新项目，我想讲述一下我最近的相反经验，以防节省任何人的时间。

因为utf8_general_ci是MySQL中Unicode的默认排序规则，所以如果您想使用utf8_Unicode_ci，那么您必须在很多地方指定它。

结果是，当将任何大小的现有系统转换为Unicode/utf8时，由于MySQL处理默认值的方式，您可能会被迫使用utf8_general_ci。

2013-07-30 13:20:02

在数据库上载文件中，在任何行之前添加以下行：