在JOIN子句和WHERE子句中放置条件之间有什么区别(性能、最佳实践等)吗?

例如……

-- Condition in JOIN
SELECT *
FROM dbo.Customers AS CUS
INNER JOIN dbo.Orders AS ORD 
ON CUS.CustomerID = ORD.CustomerID
AND CUS.FirstName = 'John'

-- Condition in WHERE
SELECT *
FROM dbo.Customers AS CUS
INNER JOIN dbo.Orders AS ORD 
ON CUS.CustomerID = ORD.CustomerID
WHERE CUS.FirstName = 'John'

你更喜欢哪一个(也许为什么)?


当前回答

最好在Join中添加条件。性能比可读性更重要。对于大型数据集,这很重要。

其他回答

WHERE将在JOIN发生后进行筛选。

在JOIN上的过滤器,以防止在JOIN过程中添加行。

对于内部连接,我并没有注意到有什么不同(但是与所有性能调优一样,您需要在您的条件下检查数据库)。

但是,如果使用左连接或右连接,将条件放在哪里会产生巨大的差异。例如,考虑以下两个查询:

SELECT *
FROM dbo.Customers AS CUS 
LEFT JOIN dbo.Orders AS ORD 
ON CUS.CustomerID = ORD.CustomerID
WHERE ORD.OrderDate >'20090515'

SELECT *
FROM dbo.Customers AS CUS 
LEFT JOIN dbo.Orders AS ORD 
ON CUS.CustomerID = ORD.CustomerID
AND ORD.OrderDate >'20090515'

第一个将只给您那些订单日期晚于2009年5月15日的记录,从而将左连接转换为内连接。

第二个将提供这些记录加上任何没有订单的客户。根据放置条件的位置不同,结果集有很大不同。(选择*仅供示例使用,当然您不应该在产品代码中使用此选项。)

这种情况的例外情况是,您希望只查看一个表中的记录,而不查看另一个表中的记录。然后使用where子句作为条件,而不是连接。

SELECT *
FROM dbo.Customers AS CUS 
LEFT JOIN dbo.Orders AS ORD 
ON CUS.CustomerID = ORD.CustomerID
WHERE ORD.OrderID is null

我更喜欢使用JOIN来连接完整的表/视图,然后使用WHERE来引入结果集的谓词。

它在语法上感觉更简洁。

最好在Join中添加条件。性能比可读性更重要。对于大型数据集,这很重要。

大多数RDBMS产品将以相同的方式优化这两个查询。在Peter Gulutzan和Trudy Pelzer的“SQL性能调优”中,他们测试了多个RDBMS品牌,并没有发现性能差异。

我倾向于将连接条件与查询限制条件分开。

如果使用OUTER JOIN,有时有必要在JOIN子句中放入条件。