如何在MySQL中进行完全外部联接？

我想在MySQL中进行完全的外部连接。这可能吗？MySQL是否支持完全外部联接？

当前回答

MySQL没有FULL-OUTER-JOIN语法。您必须通过如下方式执行LEFT JOIN和RIGHT JOIN来模拟它：

SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
UNION
SELECT * FROM t1
RIGHT JOIN t2 ON t1.id = t2.id

但MySQL也没有RIGHT JOIN语法。根据MySQL的外部连接简化，通过切换查询中FROM和ON子句中的t1和t2，将右连接转换为等效的左连接。因此，MySQL查询优化器将原始查询转换为以下内容-

SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
UNION
SELECT * FROM t2
LEFT JOIN t1 ON t2.id = t1.id

现在，按原样编写原始查询是没有害处的，但是如果您有WHERE子句之类的谓词，这是一个预连接谓词，或者on子句上的AND谓词，它是一个在连接期间的谓词，那么您可能需要看看魔鬼；这是详细的。

MySQL查询优化器定期检查谓词是否被null拒绝。

现在，如果您已经执行了RIGHT JOIN，但在t1开始的列上使用了WHERE谓词，那么您可能会遇到空拒绝的情况。

例如，查询

SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
WHERE t1.col1 = 'someValue'
UNION
SELECT * FROM t1
RIGHT JOIN t2 ON t1.id = t2.id
WHERE t1.col1 = 'someValue'

由查询优化器转换为以下内容：

SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
WHERE t1.col1 = 'someValue'
UNION
SELECT * FROM t2
LEFT JOIN t1 ON t2.id = t1.id
WHERE t1.col1 = 'someValue'

因此，表的顺序已经改变，但谓词仍然应用于t1，但t1现在位于“ON”子句中。如果t1.col1定义为NOT NULL列，则此查询将被null拒绝。

任何被null拒绝的外部联接（左、右、全）都会被MySQL转换为内部联接。

因此，您可能期望的结果可能与MySQL返回的结果完全不同。您可能会认为MySQL的RIGHT JOIN存在缺陷，但这是不对的。这就是MySQL查询优化器的工作方式。因此，负责开发人员在构建查询时必须注意这些细微差别。

2017-10-12 19:22:27

其他回答

MySQL没有FULL-OUTER-JOIN语法。您必须通过如下方式执行LEFT JOIN和RIGHT JOIN来模拟它：

SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
UNION
SELECT * FROM t1
RIGHT JOIN t2 ON t1.id = t2.id

SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
UNION
SELECT * FROM t2
LEFT JOIN t1 ON t2.id = t1.id

MySQL查询优化器定期检查谓词是否被null拒绝。

现在，如果您已经执行了RIGHT JOIN，但在t1开始的列上使用了WHERE谓词，那么您可能会遇到空拒绝的情况。

例如，查询

SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
WHERE t1.col1 = 'someValue'
UNION
SELECT * FROM t1
RIGHT JOIN t2 ON t1.id = t2.id
WHERE t1.col1 = 'someValue'

由查询优化器转换为以下内容：

SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
WHERE t1.col1 = 'someValue'
UNION
SELECT * FROM t2
LEFT JOIN t1 ON t2.id = t1.id
WHERE t1.col1 = 'someValue'

因此，表的顺序已经改变，但谓词仍然应用于t1，但t1现在位于“ON”子句中。如果t1.col1定义为NOT NULL列，则此查询将被null拒绝。

任何被null拒绝的外部联接（左、右、全）都会被MySQL转换为内部联接。

2017-10-12 19:22:27

SELECT
    a.name,
    b.title
FROM
    author AS a
LEFT JOIN
    book AS b
    ON a.id = b.author_id
UNION
SELECT
    a.name,
    b.title
FROM
    author AS a
RIGHT JOIN
    book AS b
    ON a.id = b.author_id

2013-10-24 11:10:07

使用联合查询将删除重复项，这与从不删除任何重复项的完全外部联接的行为不同：

[Table: t1]        [Table: t2]
value              value
-----------        -------
1                  1
2                  2
4                  2
4                  5

这是完全外部联接的预期结果：

value | value
------+-------
1     | 1
2     | 2
2     | 2
Null  | 5
4     | Null
4     | Null

这是使用左联合和右联合的结果：

value | value
------+-------
Null  | 5
1     | 1
2     | 2
4     | Null

SQL Fiddle

我建议的查询是：

select
    t1.value, t2.value
from t1
left outer join t2
  on t1.value = t2.value
union all      -- Using `union all` instead of `union`
select
    t1.value, t2.value
from t2
left outer join t1
  on t1.value = t2.value
where
    t1.value IS NULL

上述查询的结果与预期结果相同：

value | value
------+-------
1     | 1
2     | 2
2     | 2
4     | NULL
4     | NULL
NULL  | 5

SQL Fiddle

@史蒂夫·钱伯斯：（来自评论，非常感谢！）

注意：这可能是最佳的解决方案，既可以提高效率，也可以生成与FULL OUTER JOIN相同的结果。这篇博客文章也很好地解释了这一点，引用了方法2的话：“这可以正确处理重复的行，并且不包含任何不应该包含的内容。有必要使用UNION ALL而不是普通UNION，这将消除我想要保留的重复项。这在大型结果集上可能会更有效，因为不需要排序和删除重复项。”

我决定添加另一个来自完全外部连接可视化和数学的解决方案。它并不比上述内容更好，但更具可读性：

完全外部连接意味着（t1ût2）：都在t1或t2中（t1ût2）=（t1ğt2）+t1_only+t2_only：t1和t2中的所有值加上t1中不在t2中的全部值，以及t2中不在t1中的全部：

-- (t1 ∩ t2): all in both t1 and t2
select t1.value, t2.value
from t1 join t2 on t1.value = t2.value
union all  -- And plus
-- all in t1 that not exists in t2
select t1.value, null
from t1
where not exists( select 1 from t2 where t2.value = t1.value)
union all  -- and plus
-- all in t2 that not exists in t1
select null, t2.value
from t2
where not exists( select 1 from t1 where t2.value = t1.value)

SQL Fiddle

2015-05-28 05:01:38

巴勃罗·圣克鲁斯给出的答案是正确的；然而，如果有人无意中看到了这一页，并希望得到更多的澄清，这里有一个详细的分类。

示例表

假设我们有以下表格：

-- t1
id  name
1   Tim
2   Marta

-- t2
id  name
1   Tim
3   Katarina

内连接

内部连接，如下所示：

SELECT *
FROM `t1`
INNER JOIN `t2` ON `t1`.`id` = `t2`.`id`;

将只获取两个表中出现的记录，如下所示：

1 Tim  1 Tim

内部连接没有方向（如左或右），因为它们是显式双向的——我们需要两边都匹配。

外连接

另一方面，外部联接用于查找其他表中可能不匹配的记录。因此，您必须指定允许连接的哪一侧缺少记录。

LEFT JOIN和RIGHT JOIN是LEFT OUTER JOIN和RIGHT OUTER JON的简写；我将在下面使用它们的全名来强化外部连接与内部连接的概念。

左侧外部连接

左外连接，如下所示：

SELECT *
FROM `t1`
LEFT OUTER JOIN `t2` ON `t1`.`id` = `t2`.`id`;

…将从左表中获取所有记录，无论它们在右表中是否匹配，如下所示：

1 Tim   1    Tim
2 Marta NULL NULL

右侧外部连接

右外部连接，如下所示：

SELECT *
FROM `t1`
RIGHT OUTER JOIN `t2` ON `t1`.`id` = `t2`.`id`;

…将从右表中获取所有记录，无论它们在左表中是否匹配，如下所示：

1    Tim   1  Tim
NULL NULL  3  Katarina

完全外部联接

一个完整的外部联接将为我们提供两个表中的所有记录，无论它们在另一个表中是否匹配，在没有匹配的两侧都有NULL。结果如下：

1    Tim   1    Tim
2    Marta NULL NULL
NULL NULL  3    Katarina

然而，正如Pablo Santa Cruz所指出的，MySQL不支持这一点。我们可以通过执行左联接和右联接的UNION来模拟它，如下所示：

SELECT *
FROM `t1`
LEFT OUTER JOIN `t2` ON `t1`.`id` = `t2`.`id`

UNION

SELECT *
FROM `t1`
RIGHT OUTER JOIN `t2` ON `t1`.`id` = `t2`.`id`;

您可以将UNION看作是“运行这两个查询，然后将结果叠加在一起”；其中一些行来自第一个查询，一些来自第二个查询。

需要注意的是，MySQL中的UNION将消除完全的重复：Tim将出现在这里的两个查询中，但UNION的结果只列出了他一次。我的数据库专家同事认为不应该依赖这种行为。因此，为了更加明确，我们可以在第二个查询中添加WHERE子句：

SELECT *
FROM `t1`
LEFT OUTER JOIN `t2` ON `t1`.`id` = `t2`.`id`

UNION

SELECT *
FROM `t1`
RIGHT OUTER JOIN `t2` ON `t1`.`id` = `t2`.`id`
WHERE `t1`.`id` IS NULL;

另一方面，如果出于某种原因希望看到重复项，可以使用UNION ALL。

2012-02-09 16:23:09

为了更清晰，我修改了shA.t的查询：

-- t1 left join t2
SELECT t1.value, t2.value
FROM t1 LEFT JOIN t2 ON t1.value = t2.value   

    UNION ALL -- include duplicates

-- t1 right exclude join t2 (records found only in t2)
SELECT t1.value, t2.value
FROM t1 RIGHT JOIN t2 ON t1.value = t2.value
WHERE t1.value IS NULL

2016-03-11 08:47:04

如何在MySQL中进行完全外部联接？

推荐文章

最新文章

标签