哪个更快/最好?SELECT *或SELECT columnn1, colum2, column3等

我听说在编写SQL命令时使用SELECT *通常是不好的做法，因为选择您特别需要的列会更有效。

如果我需要选择表中的每一列，我应该使用

SELECT * FROM TABLE

SELECT column1, colum2, column3, etc. FROM TABLE

在这种情况下，效率真的重要吗?如果你真的需要所有的数据，我认为SELECT *在内部会更优，但我这么说并没有真正理解数据库。

我很好奇在这种情况下最好的做法是什么。

更新:我可能应该指定，我真正想要执行SELECT *的唯一情况是，当我从一个表中选择数据时，我知道总是需要检索所有列，即使添加了新列。

然而，鉴于我所看到的反应，这似乎仍然是一个坏主意，由于我曾经考虑过的许多技术原因，SELECT *不应该被使用。

当前回答

“select *”的问题在于可能会带来您并不真正需要的数据。在实际的数据库查询期间，所选列并不会真正增加计算量。真正“繁重”的是将数据传输回客户端，任何您并不真正需要的列都只会浪费网络带宽，并增加等待查询返回的时间。

即使您确实使用了来自“select *…”的所有列，这也只是暂时的。如果将来您更改表/视图布局并添加更多列，您将开始在您的选择中引入这些列，即使您不需要它们。

“select *”语句不好的另一个地方是视图创建。如果您使用“select *”创建了一个视图，然后向表中添加列，则视图定义和返回的数据将不匹配，您需要重新编译视图以使它们再次工作。

我知道写一个“选择*”是诱人的，因为我真的不喜欢手动指定所有的字段在我的查询，但当你的系统开始发展，你会发现这是值得花额外的时间/精力在指定字段，而不是花更多的时间和精力消除错误在你的视图或优化你的应用程序。

2008-09-15 18:47:35

其他回答

考虑到您正在选择所有列的规范，此时没有什么不同。但是，要意识到数据库模式确实会发生变化。如果您使用SELECT *，您将获得添加到表中的任何新列，即使您的代码很可能不准备使用或显示这些新数据。这意味着您正在将系统暴露给意外的性能和功能更改。

你可能会认为这是一个很小的开销，但要意识到你不需要的列仍然必须是:

从数据库读取通过网络发送编组到流程中 (适用于adotype技术)保存在内存中的数据表中忽略和丢弃/垃圾收集

第1项有许多隐藏的成本，包括消除一些潜在的覆盖索引，导致数据页负载(和服务器缓存抖动)，引发行/页/表锁，这些锁本来是可以避免的。

将此与指定列而不是*的潜在节省进行平衡，唯一潜在的节省是:

程序员不需要重新访问SQL来添加列 SQL的网络传输更小/更快 SQL Server查询解析/验证时间 SQL Server查询计划缓存

对于第1项，实际情况是，您将添加/更改代码以使用您可能添加的任何新列，因此这是徒劳的。

对于第2项，这种差异很少足以使您使用不同的数据包大小或网络数据包数量。如果SQL语句传输时间是主要问题，那么可能首先需要降低语句的速率。

对于第3项，没有任何节省，因为无论如何都必须展开*，这意味着无论如何都要咨询表的模式。实际上，列出列也会产生相同的成本，因为它们必须根据模式进行验证。换句话说，这完全是一笔勾销。

对于第4项，当您指定特定列时，您的查询计划缓存可能会变大，但只有当您处理不同的列集时(这不是您所指定的)。在这种情况下，您确实需要不同的缓存条目，因为您需要根据需要使用不同的计划。

因此，由于您指定问题的方式，这一切都归结为面对最终模式修改时的问题弹性。如果您正在将这个模式刻录到ROM(这种情况会发生)，那么*是完全可以接受的。

但是，我的一般指导原则是，您应该只选择您需要的列，这意味着有时看起来像是您在请求所有这些列，但是dba和模式演变意味着可能会出现一些可能会极大地影响查询的新列。

我的建议是你应该总是选择特定的列。记住，你会不断擅长你所做的事情，所以要养成正确做这件事的习惯。

如果您想知道为什么模式可以在不更改代码的情况下更改，可以考虑审计日志、有效/过期日期和dba系统地添加的其他类似内容，以解决遵从性问题。另一个幕后更改的来源是系统中其他地方或用户定义字段的性能反规范化。

2008-09-15 21:53:18

如果你需要每一列，那么只需使用SELECT *，但记住，顺序可能会改变，所以当你消费的结果访问他们的名字，而不是通过索引。

我将忽略关于*需要如何获得列表的注释-解析和验证命名列的机会等于处理时间，如果不是更多的话。不要过早地优化;-)

2008-09-15 18:44:14

准确地说出需要哪些列是更好的实践的一个原因是，将来可能会对表结构进行更改。

如果您正在使用基于索引的方法手动读入数据，用查询结果填充数据结构，那么将来当您添加/删除列时，您将会头疼地试图找出哪里出了问题。

至于哪种方法更快，我会听取别人的专业意见。

2008-09-15 18:44:17

当您有一个连接时，不使用select *对于性能特别重要，因为根据定义，至少两个字段包含相同的数据。您不希望将不需要的数据从数据库服务器发送到应用程序或web服务器而浪费网络资源。使用select *似乎更简单，但这是一种糟糕的做法。由于很容易将列名拖到查询中，所以只需这样做即可。

Another issue that occurs when using select * is that there are idiots who choose to add new fields in the middle fo the table (always a bad practice), if you use select * as the basis for an insert then suddenly your column order may be wrong and you may try to insert the social security number into the honorarium (the amoutn of money a speaker may get paid to pick a non-random example) which could be a very bad thing for data integrity. Even if the select isn't an insert, it looks bad to the customer when the data is suddenly in the worng order on the report or web page.

我认为在任何情况下使用select *都不会比使用列列表更好。您可能认为这样更容易维护，但事实并非如此，而且当您不需要的字段被添加到表中时，会导致您的应用程序毫无理由地变慢。您还必须面对修复问题，如果您使用列列表就不会损坏，因此您节省的不添加列的时间将用于此操作。

2008-09-16 13:38:22

上面所有人说的，加上:

如果你正在努力编写可读性强、可维护的代码，可以这样做:

SELECT foo, bar FROM widgets;

立即可读并显示意图。如果你打了那个电话，你知道你会得到什么。如果widget只有foo和bar列，那么选择*意味着您仍然需要考虑返回什么，确认顺序映射正确等等。然而，如果widget有更多的列，但您只对foo和bar感兴趣，那么当您查询通配符，然后只使用返回的部分内容时，您的代码就会变得混乱。

2010-06-04 07:54:14

哪个更快/最好?SELECT *或SELECT columnn1, colum2, column3等

推荐文章

最新文章

标签