我正在对一个数据库应用程序进行一些维护工作,我发现,最令人高兴的是,即使一个表的值以外键的样式使用,但表上没有外键约束。

我试图在这些列上添加FK约束,但我发现,因为在以前的错误中已经有大量坏数据,这些错误已经被天真地纠正了,所以我需要找到与另一个表不匹配的行,然后删除它们。

我在网上找到了一些这类查询的例子,但它们似乎都提供了例子而不是解释,我不明白为什么它们能起作用。

有人能向我解释一下如何构造一个查询,返回另一个表中没有匹配的所有行,以及它在做什么,这样我就可以自己进行这些查询,而不是对这个混乱中没有FK约束的每个表运行so ?


当前回答

从类似的问题这里MySQL内部连接查询获取记录不存在于其他表,我得到了这个工作

SELECT * FROM bigtable 
LEFT JOIN smalltable ON bigtable.id = smalltable.id 
WHERE smalltable.id IS NULL

Smalltable是丢失记录的地方,bigtable是所有记录的地方。该查询列出了小表中不存在但大表中存在的所有记录。您可以用任何其他匹配条件替换id。

其他回答

SELECT * FROM First_table - SELECT * FROM other

我会使用EXISTS表达式,因为它更强大,你可以更精确地选择你想要加入的行。在LEFT JOIN的情况下,你必须获取连接表中的所有东西。它的效率可能与带有空约束的LEFT JOIN的情况相同。

SELECT t1.ID
FROM Table1 t1
WHERE NOT EXISTS (SELECT t2.ID FROM Table2 t2 WHERE t1.ID = t2.ID)

其中T2是要添加约束的表:

SELECT *
FROM T2
WHERE constrained_field NOT
IN (
    SELECT DISTINCT t.constrained_field
    FROM T2 
    INNER JOIN T1 t
    USING ( constrained_field )
)

并删除结果。

从类似的问题这里MySQL内部连接查询获取记录不存在于其他表,我得到了这个工作

SELECT * FROM bigtable 
LEFT JOIN smalltable ON bigtable.id = smalltable.id 
WHERE smalltable.id IS NULL

Smalltable是丢失记录的地方,bigtable是所有记录的地方。该查询列出了小表中不存在但大表中存在的所有记录。您可以用任何其他匹配条件替换id。

我不知道哪个是优化的(与@AdaTheDev相比 但是我用这个似乎更快(至少对我来说)

SELECT id  FROM  table_1 EXCEPT SELECT DISTINCT (table1_id) table1_id FROM table_2

如果你想获得任何其他特定的属性,你可以使用:

SELECT COUNT(*) FROM table_1 where id in (SELECT id  FROM  table_1 EXCEPT SELECT DISTINCT (table1_id) table1_id FROM table_2);