总是使用nvarchar(MAX)有什么缺点吗?

在SQL Server 2005中，将所有字符字段设置为nvarchar(MAX)而不是显式指定长度(例如nvarchar(255))有什么缺点吗?(除了不能在数据库级别限制字段长度之外)

当前回答

截至SQL Server 2019, NVARCHAR(MAX)仍然不支持SCSU“Unicode压缩”-即使使用行内数据存储存储。SCSU是在SQL Server 2008中添加的，适用于任何ROW/ page压缩的表和索引。

因此，即使没有存储在LOB中，具有相同文本内容的NVARCHAR(1..4000)字段所占用的物理磁盘空间也是NVARCHAR(1..4000)字段的两倍。非scsu浪费取决于所表示的数据和语言。

Unicode压缩实现:

SQL Server使用Unicode标准压缩方案(SCSU)算法的实现来压缩存储在行或页压缩对象中的Unicode值。对于这些压缩对象，对nchar(n)和nvarchar(n)列的Unicode压缩是自动的[并且从未对nvarchar(max)使用]。

另一方面，PAGE压缩(自2014年以来)仍然适用于NVARCHAR(MAX)列，如果它们被写入行内数据。所以缺乏SCSU感觉就像“缺少优化”。与SCSU不同，基于共享前导前缀(例如。重复的值)。

然而，使用NVARCHAR(MAX)可能仍然“更快”，即使使用OPENJSON这样的函数会有更高的IO成本，因为它避免了隐式转换。这是一种隐式转换开销，它取决于使用的相对成本，以及字段是在过滤之前还是过滤之后被处理的。在VARCHAR(MAX)列中使用2019年的UTF-8排序规则时也存在同样的转换问题。

使用NVARCHAR(1-4000)也需要N*2个字节的~8000字节行配额，而NVARCHAR(MAX)只需要24个字节。总体设计和使用需要一起考虑，以考虑具体的实现细节。

+在我的数据库/数据/模式中，通过使用两列(读时合并)，可以减少40%的磁盘空间使用，同时仍然支持溢出的文本值。SCSU虽然存在缺陷，但它是一种非常聪明且未得到充分利用的存储Unicode的更有效空间的方法。

2021-02-16 04:17:51

其他回答

1)当处理nvarchar(max) vs nvarchar(n)时，SQL服务器将不得不利用更多的资源(分配的内存和cpu时间)，其中n是一个特定于字段的数字。

2)就绩效而言，这意味着什么?

在SQL Server 2005上，我从一个有15个nvarchar(max)列的表中查询了13000行数据。我重复计时查询，然后将列更改为nvarchar(255)或更小。

优化之前的查询平均为2.0858秒。更改后的查询平均返回时间为1.90秒。这比基本select *查询提高了约184毫秒。这一数字提高了8.8%。

3)我的结果与其他几篇文章一致，表明存在性能差异。根据数据库和查询的不同，改进的百分比可能有所不同。如果您没有很多并发用户或很多记录，那么性能差异对您来说不是问题。但是，随着记录和并发用户的增加，性能差异也会增加。

2013-04-29 08:05:41

这将使屏幕设计变得更加困难，因为你将不再能够预测你的控制应该有多宽。

2008-09-29 12:33:03

同样的问题也出现在MSDN论坛上:

Varchar(max) vs Varchar(255)

原文(更多信息):

When you store data to a VARCHAR(N) column, the values are physically stored in the same way. But when you store it to a VARCHAR(MAX) column, behind the screen the data is handled as a TEXT value. So there is some additional processing needed when dealing with a VARCHAR(MAX) value. (only if the size exceeds 8000) VARCHAR(MAX) or NVARCHAR(MAX) is considered as a 'large value type'. Large value types are usually stored 'out of row'. It means that the data row will have a pointer to another location where the 'large value' is stored...

2008-09-29 12:25:44

当你知道字段将在一个固定的范围内时，这不是一个好主意——例如5到10个字符。我想我只会在不确定长度的情况下使用max。例如，电话号码永远不会超过一定数量的字符。

你能诚实地说，你不确定表中每个字段的大约长度要求吗?

我确实明白你的意思——有些字段我肯定会考虑使用varchar(max)。

有趣的是，MSDN文档总结得很好:

的大小时使用varchar 列数据条目变化很大。的大小时使用varchar(max) 列数据条目变化很大，大小可能超过8000字节。

关于这个问题有一个有趣的讨论。

2009-06-08 19:36:10

一个缺点是，您将围绕一个不可预知的变量进行设计，您可能会忽略而不是利用内部SQL Server数据结构，逐步由Row(s)、Page(s)和Extent(s)组成。

这让我想到了C中的数据结构对齐，并且通常认为知道对齐是一件好事(TM)。相似的想法，不同的背景。

页面和区段的MSDN页面

行溢出数据的MSDN页面