为什么认为SELECT *有害?

为什么SELECT *是不好的做法?如果您添加了想要的新列，这难道不意味着需要更改的代码更少吗?

我知道SELECT COUNT(*)在某些db上是一个性能问题，但是如果您真的想要每个列呢?

当前回答

在很多情况下，SELECT *会在应用程序的运行时导致错误，而不是在设计时。它隐藏了应用程序中列更改或坏引用的信息。

2010-09-03 22:07:46

其他回答

引用自这篇文章。

永远不要用“SELECT *”，

我发现使用“SELECT *”的原因只有一个。

如有特殊要求和创建动态环境时添加或删除列，由应用程序代码自动处理。在这种特殊情况下，您不需要更改应用程序和数据库代码，这将自动影响生产环境。在这种情况下，您可以使用“SELECT *”。

2016-02-07 12:32:02

如果您将字段添加到表中，它们将自动包含在使用select *的所有查询中。这看起来很方便，但它会使您的应用程序变慢，因为您获取的数据比您需要的要多，并且它实际上会在某些时候使您的应用程序崩溃。

在结果的每一行中可以获取多少数据是有限制的。如果向表中添加字段导致结果超过了限制，则在尝试运行查询时将收到错误消息。

这是一种很难发现的错误。您在一个地方做了更改，而在另一个实际上根本不使用新数据的地方它就会崩溃。它甚至可能是一个不太常用的查询，以至于在有人使用它之前需要一段时间，这使得将错误与更改联系起来更加困难。

如果指定希望在结果中显示哪些字段，就不会出现这种开销溢出。

2010-09-03 22:41:20

使用列名进行选择提高了数据库引擎从索引访问数据的可能性，而不是查询表数据。

当数据库模式发生变化时，SELECT *使您的系统暴露在意想不到的性能和功能变化中，因为您要将任何新列添加到表中，即使您的代码还没有准备好使用或显示这些新数据。

2017-08-22 12:20:25

如果您真的想要每个列，我没有看到select(*)和命名列之间的性能差异。命名列的驱动程序可能只是为了明确您希望在代码中看到哪些列。

但是，通常情况下，您不希望每个列和select(*)会导致数据库服务器做不必要的工作，并且必须通过网络传递不必要的信息。它不太可能造成明显的问题，除非系统被大量使用或网络连接很慢。

2010-09-03 22:08:08

这里有一个重要的区别，我认为大多数答案都忽略了。

SELECT *不是问题。返回SELECT *的结果是问题所在。

举个例子，在我看来:

WITH data_from_several_tables AS (
    SELECT * FROM table1_2020
        UNION ALL
    SELECT * FROM table1_2021
    ...
)
SELECT id, name, ...
FROM data_from_several_tables
WHERE ...
GROUP BY ...
...

这避免了大多数答案中提到的使用SELECT *的所有“问题”:

读取的数据比预期的多?现代数据库中的优化器会意识到实际上并不需要所有列源表的列顺序会影响输出吗?我们仍然选择和显式返回数据。消费者不能看到他们从SQL?您所操作的列在代码中是显式的。索引可能不被使用?同样，现代优化器应该处理这个问题，就像我们没有选择*一样

这里有一个可读性/可重构性的优势——不需要重复很长的列列表或其他常见的查询子句(如过滤器)。如果在使用SELECT *和SELECT <columns>(在绝大多数情况下-显然总是在关键情况下配置运行代码)时，查询计划有任何不同，我会感到惊讶。

2023-02-02 21:19:03

为什么认为SELECT *有害?

推荐文章

最新文章

标签