我有可变长度的字符数据,想存储在SQL Server(2005)数据库。我想学习一些关于如何选择TEXT SQL类型或选择VARCHAR SQL类型的最佳实践,在性能/占用空间/功能方面的利弊。


TEXT用于大块的字符串数据。如果字段的长度超过某个阈值,则文本将行外存储。

VARCHAR始终存储在行中,并且限制为8000个字符。如果你尝试创建一个VARCHAR(x),其中x > 8000,你会得到一个错误:

服务器:Msg 131,级别15,状态3,线路1 给类型' varchar '的size()超过了任何数据类型允许的最大值(8000)

这些长度限制与SQL Server 2005中的VARCHAR(MAX)无关,它可以像TEXT一样按行存储。

注意MAX在这里不是一种常量,VARCHAR和VARCHAR(MAX)是非常不同的类型,后者非常接近TEXT。

在以前版本的SQL Server,你不能直接访问文本,你只能得到一个TEXTPTR,并在READTEXT和WRITETEXT函数中使用它。

在SQL Server 2005中,您可以直接访问TEXT列(尽管您仍然需要显式转换为VARCHAR来为它们分配值)。

文本是好的:

如果您需要在数据库中存储大型文本 如果不搜索列的值 如果您很少选择此列,并且不加入该列。

VARCHAR很好:

如果存储小字符串 如果你搜索字符串值 如果你总是选择它或在连接中使用它。

这里的选择是指发出任何返回列值的查询。

这里的搜索是指发出任何查询,其结果取决于TEXT或VARCHAR列的值。这包括在任何JOIN或WHERE条件中使用它。

由于TEXT存储在行外,不涉及TEXT列的查询通常更快。

一些文本的好处的例子:

博客评论 Wiki页面 代码源

VARCHAR的一些优点:

用户名 页面标题 文件名

作为一个经验法则,如果你需要你的文本值超过200个字符,并且不使用join在这个列上,使用text。

否则使用VARCHAR。

附注:这同样适用于启用UNICODE的NTEXT和NVARCHAR,你应该在上面的例子中使用它们。

这同样适用于SQL Server 2005+使用的VARCHAR(MAX)和NVARCHAR(MAX),而不是TEXT和NTEXT。如果您希望它们始终存储在行外,则需要使用sp_tableoption为它们启用行外大值类型。

正如上面和这里提到的,TEXT将在未来的版本中被弃用:

在SQL Server的未来版本中,将删除“行中文本”选项。避免在新的开发工作中使用此选项,并计划修改当前使用行文本的应用程序。我们建议您使用varchar(max)、nvarchar(max)或varbinary(max)数据类型来存储大数据。若要控制这些数据类型的行内和行外行为,请使用行外大值类型选项。


如果您正在使用SQL Server 2005或更高版本,请使用varchar(MAX)。文本数据类型已弃用,不应用于新的开发工作。从文档中可以看出:

重要的 在未来版本的Microsoft SQL Server中将删除ntext、文本和图像数据类型。避免在新的开发工作中使用这些数据类型,并计划修改当前使用它们的应用程序。请使用nvarchar(max)、varchar(max)和varbinary(max)。


在SQL server 2005中引入了新的数据类型:varchar(max)和nvarchar(max) 它们具有旧的文本类型的优点:它们可以包含op到2GB的数据,但它们也具有varchar和nvarchar的大部分优点。这些优点包括能够使用字符串操作函数,如substring()。

此外,varchar(max)存储在表的(磁盘/内存)空间中,当大小小于8Kb时。只有当您在字段中放置更多数据时,它才会存储在表的空间之外。存储在表空间中的数据(通常)可以更快地检索。

简而言之,永远不要使用Text,因为有一个更好的选择:(n)varchar(max)。只有当普通的varchar不够大时才使用varchar(max),即如果您希望存储的字符串超过8000个字符。

如前所述,可以在TEXT数据类型上使用SUBSTRING,但前提是TEXT字段包含的字符少于8000个。


在决定使用什么数据类型时,可能值得考虑下面的文章。 http://msdn.microsoft.com/en-us/library/ms143432.aspx

字节的

Varchar (max), varbinary(max), xml,文本或图像列2^31-1 2^31-1 Nvarchar (max)列2^30-1 2^30-1