INT和VARCHAR主键之间有真正的性能差异吗?

在MySQL中使用INT和VARCHAR作为主键之间有可测量的性能差异吗?我想使用VARCHAR作为参考列表的主键(认为美国州，国家代码)和同事不会在INT AUTO_INCREMENT作为所有表的主键上让步。

我的论点是，INT和VARCHAR之间的性能差异可以忽略不计，因为每个INT外键引用都需要一个JOIN来理解引用，VARCHAR键将直接显示信息。

那么，有人对这个特殊的用例以及与之相关的性能问题有过经验吗?

当前回答

和往常一样，没有统一的答案。“这取决于!我不是在开玩笑。我对原始问题的理解是小表上的键-像Country(整数id或char/varchar代码)是潜在的大表(如地址/联系表)的外键。

当您希望从DB返回数据时，这里有两种场景。首先是一个列表/搜索类型的查询，其中您希望列出所有带有州和国家代码或名称的联系人(id没有帮助，因此需要查找)。另一个是在主键上的get场景，它显示单个联系人记录，其中需要显示州名和国家。

For the latter get, it probably does not matter what the FK is based on since we are bringing together tables for a single record or a few records and on key reads. The former (search or list) scenario may be impacted by our choice. Since it is required to show country (at least a recognizable code and perhaps even the search itself includes a country code), not having to join another table through a surrogate key can potentially (I am just being cautious here because I have not actually tested this, but seems highly probable) improve performance; notwithstanding the fact that it certainly helps with the search.

由于代码很小——国家和州通常不超过3个字符，在这种情况下使用自然键作为外键是可以的。

另一种情况是，键依赖于较长的varchar值，也可能依赖于较大的表;代理键可能具有优势。

2017-04-26 23:14:53

其他回答

请允许我说，考虑到性能范围(开箱即用定义)，肯定有区别:

1-在应用程序中使用代理int更快，因为你不需要在你的代码或查询中使用ToUpper()， ToLower()， ToUpperInvarient()或ToLowerInvarient()，这4个函数有不同的性能基准。请参阅关于此的Microsoft性能规则。(申请的表现)

2-使用代理int保证不随时间改变键。甚至国家代码也可能发生变化，请参阅维基百科ISO代码如何随时间变化。这将花费大量时间来更改子树的主键。(数据维护的表现)

3- ORM解决方案似乎有问题，比如当PK/FK不是int时NHibernate。开发人员(性能)

2018-03-23 07:24:20

这个问题是关于MySQL的，所以我说有很大的区别。如果是关于Oracle(它将数字存储为字符串——是的，一开始我不敢相信)，那么没有太大区别。

表中的存储不是问题，更新和引用索引才是问题。涉及基于主键查找记录的查询非常频繁——您希望它们尽可能快地出现，因为它们经常发生。

问题是CPU自然地处理4字节和8字节的整数，在硅中。它比较两个整数真的很快——它发生在一个或两个时钟周期内。

现在看一个字符串——它由很多字符组成(现在每个字符超过一个字节)。比较两个字符串的优先级不能在一个或两个循环中完成。相反，字符串的字符必须迭代，直到发现差异。我确信在某些数据库中有一些技巧可以让它更快，但在这里这无关紧要，因为在硅中，CPU会自然地进行int比较，并且速度很快。

我的一般规则-每个主键都应该是一个自动递增的INT，特别是在使用ORM (Hibernate, Datanucleus，等等)的OO应用程序中，对象之间有很多关系-它们通常总是作为一个简单的FK实现，DB快速解析这些关系的能力对你的应用程序很重要。响应性。

2016-11-30 07:24:32

在HauteLook，我们将许多表改为使用自然键。我们确实体验到了真实世界的性能提升。正如您所提到的，我们的许多查询现在使用更少的连接，这使得查询的性能更高。如果有意义，我们甚至会使用复合主键。话虽如此，有些表如果有代理键就更容易使用。

另外，如果您让人们编写到您的数据库的接口，代理键可能会很有帮助。第三方可以依赖代理键只在非常罕见的情况下才会更改这一事实。

2012-10-17 02:47:12

对于短代码，可能没有区别。当保存这些代码的表可能非常小(最多几千行)并且不经常更改(我们上一次添加新的US State是什么时候)时，这一点尤其正确。

对于键之间变化较大的大型表，这可能是危险的。例如，考虑使用user表中的电子邮件地址/用户名。如果你有几百万用户，其中一些用户有很长的名字或电子邮件地址，会发生什么?现在，任何时候你需要使用这个键来连接这个表，它就变得非常昂贵。

2008-12-01 21:30:09

不确定性能的影响，但它似乎是一个可能的妥协，至少在开发过程中，将包括自动递增的整数“代理”键，以及您预期的唯一的“自然”键。这将使您有机会评估性能以及其他可能的问题，包括自然键的可变性。

2008-12-01 21:43:26

INT和VARCHAR主键之间有真正的性能差异吗?

推荐文章

最新文章

标签