文本数据类型和字符变化(varchar)数据类型之间的区别是什么?

根据文档

如果使用不带长度说明符的字符变化,则该类型接受任何大小的字符串。后者是PostgreSQL的扩展。

and

此外,PostgreSQL还提供了文本类型,用于存储任意长度的字符串。尽管类型text不在SQL标准中,但其他几个SQL数据库管理系统也具有它。

那么有什么不同呢?


当前回答

在我看来,varchar(n)有它自己的优点。是的,它们都使用相同的底层类型等等。但是,应该指出的是,PostgreSQL中的索引有其每行2712字节的大小限制。

TL;博士: 如果您使用无约束的文本类型,并且在这些列上有索引,则很可能在某些列上达到此限制,并在尝试插入数据时出错,但使用varchar(n)可以防止这种情况。

Some more details: The problem here is that PostgreSQL doesn't give any exceptions when creating indexes for text type or varchar(n) where n is greater than 2712. However, it will give error when a record with compressed size of greater than 2712 is tried to be inserted. It means that you can insert 100.000 character of string which is composed by repetitive characters easily because it will be compressed far below 2712 but you may not be able to insert some string with 4000 characters because the compressed size is greater than 2712 bytes. Using varchar(n) where n is not too much greater than 2712, you're safe from these errors.

其他回答

没有区别,在引子里都是可变长度数组。

查看本文来自Depesz: http://www.depesz.com/index.php/2010/03/02/charx-vs-varcharx-vs-varchar-vs-text/

以下是几个亮点:

总结一下: Char (n)——在处理小于n的值时占用太多空间(将它们填充到n),并且由于添加尾随会导致微妙的错误 空格,加上改变极限是有问题的 Varchar (n) -在活动环境中更改限制是有问题的(在更改表时需要排他锁) Varchar -就像文本一样 Text -对我来说是胜过(n)数据类型的赢家,因为它没有数据类型的问题,胜过varchar -因为它有独特的名称

本文进行了详细的测试,以证明所有4种数据类型的插入和选择的性能是相似的。它还详细介绍了在需要时限制长度的其他方法。基于函数的约束或域提供了立即增加长度约束的优势,并且基于减少字符串长度约束的情况很少,depesz得出结论,它们中的一个通常是长度限制的最佳选择。

如果你只使用文本类型,在使用AWS数据库迁移服务时可能会遇到问题:

使用大对象(LOB),但目标LOB列不能为空

由于大型对象(lob)的大小未知且有时较大,因此需要更多的处理 和资源比标准对象。以帮助调整包含 lob, AWS DMS提供以下选项

如果你在所有事情上都坚持使用PostgreSQL,那么你可能没问题。但如果你打算通过ODBC或DMS等外部工具与你的db交互,你应该考虑不要事事使用TEXT。

在PostgreSQL手册上

There is no performance difference among these three types, apart from increased storage space when using the blank-padded type, and a few extra CPU cycles to check the length when storing into a length-constrained column. While character(n) has performance advantages in some other database systems, there is no such advantage in PostgreSQL; in fact character(n) is usually the slowest of the three because of its additional storage costs. In most situations text or character varying should be used instead.

我通常使用文本

引用:http://www.postgresql.org/docs/current/static/datatype-character.html

character varying(n), varchar(n) -(两者相同)。值将被截断为n个字符而不引发错误。 character(n), char(n) -(都是一样的)。固定长度,并将空白垫至长度结束。 文本-无限长度。

例子:

Table test:
   a character(7)
   b varchar(7)

insert "ok    " to a
insert "ok    " to b

我们得到了结果:

a        | (a)char_length | b     | (b)char_length
----------+----------------+-------+----------------
"ok     "| 7              | "ok"  | 2

区别在于传统和现代。

传统上,您需要指定每个表列的宽度。如果您指定的宽度太大,则会浪费昂贵的存储空间,但如果您指定的宽度太小,则一些数据将无法存储。然后你将调整列的大小,并不得不改变许多连接的软件,修复引入的错误,这都是非常麻烦的。

现代系统允许使用动态存储分配的无限字符串存储,因此附带的大字符串可以很好地存储,而不会浪费存储小数据项。

虽然许多编程语言都采用了无限大小的“字符串”数据类型,如c#、javascript、java等,但像Oracle这样的数据库却没有。

现在PostgreSQL支持“text”,很多程序员仍然习惯VARCHAR(N),并推理:是的,文本和VARCHAR是一样的,除了VARCHAR你可以添加一个限制N,所以VARCHAR更灵活。

你可能会想,既然我们可以用TEXT简化我们的生活,为什么我们要使用没有N的VARCHAR呢?

在我使用Oracle的最近几年里,我很少使用CHAR(N)或VARCHAR(N)。因为Oracle没有无限的字符串类型,所以我对大多数字符串列使用VARCHAR(2000),其中2000在某些时候是VARCHAR的最大值,在所有实际用途中与'infinite'没有太大区别。

现在我正在使用PostgreSQL,我认为TEXT是真正的进步。不再强调CHAR类型的VAR特性。不再强调让我们使用没有n的VARCHAR。此外,输入TEXT比VARCHAR节省了3个按键。

现在,年轻的同事在成长过程中甚至不知道过去没有无限的限制。就像在大多数项目中一样,他们不需要了解汇编编程。