如何删除重复的行?

我需要从一个相当大的SQL Server表(即300,000+行)中删除重复的行。

当然，由于RowID标识字段的存在，这些行不会完全重复。

MyTable

RowID int not null identity(1,1) primary key,
Col1 varchar(20) not null,
Col2 varchar(2048) not null,
Col3 tinyint not null

我该怎么做呢?

当前回答

现在让我们看看elasticalsearch表，这个表有重复的行，Id是相同的uniq字段。我们知道如果某个id存在于某个组条件下，那么我们可以删除该组作用域之外的其他行。我的举止表明了这一标准。

很多情况下，这个线程是在类似的状态，我。只需根据删除重复(重复)行的情况更改目标组条件。

DELETE 
FROM elasticalsearch
WHERE Id NOT IN 
               (SELECT min(Id)
                     FROM elasticalsearch
                     GROUP BY FirmId,FilterSearchString
                     )

干杯

2016-01-11 20:31:40

其他回答

另一种方法是创建一个具有相同字段和唯一索引的新表。然后将所有数据从旧表移动到新表。自动SQL SERVER忽略(也有一个选项说明如果有重复值该怎么做:忽略，中断或…)重复值。所以我们有相同的表，没有重复的行。如果你不想要唯一索引，传输数据后，你可以放弃它。

特别是对于较大的表，您可以使用DTS (SSIS包导入/导出数据)，以便将所有数据快速传输到新的唯一索引表中。700万行只需要几分钟。

2013-09-18 06:36:12

创建具有相同结构的新空白表像这样执行查询插入tc_category1 SELECT * 从tc_category GROUP BY category_id, application_id count(*) > 然后执行这个查询插入tc_category1 SELECT * 从tc_category GROUP BY category_id, application_id count(*) = 1

2009-05-08 13:06:42

哦,当然。使用临时表。如果你想要一个“工作”的单一的、性能不太好的语句，你可以使用:

DELETE FROM MyTable WHERE NOT RowID IN
    (SELECT 
        (SELECT TOP 1 RowID FROM MyTable mt2 
        WHERE mt2.Col1 = mt.Col1 
        AND mt2.Col2 = mt.Col2 
        AND mt2.Col3 = mt.Col3) 
    FROM MyTable mt)

基本上，对于表中的每一行，子选择将查找与所考虑行的完全相同的所有行的顶部RowID。因此，您最终会得到一个表示“原始”非重复行的RowIDs列表。

2008-08-20 22:27:53

删除重复记录

在这种情况下，大于操作符删除除第一条记录以外的所有记录

u1 FROM users u1 JOIN users u2 u1的地方。Id > u2.id 和u1.email = u2.email

<小于操作符在这种情况下删除除最后一条记录以外的所有记录

u1 FROM users u1 JOIN users u2 u1的地方。Id < u2.id 和u1.email = u2.email

2022-06-17 12:21:24

很多情况下，这个线程是在类似的状态，我。只需根据删除重复(重复)行的情况更改目标组条件。

DELETE 
FROM elasticalsearch
WHERE Id NOT IN 
               (SELECT min(Id)
                     FROM elasticalsearch
                     GROUP BY FirmId,FilterSearchString
                     )

干杯

2016-01-11 20:31:40

如何删除重复的行?

推荐文章

最新文章

标签