我如何在mongo集合中找到重复的字段。

我想检查是否有任何“name”字段是重复的。

{
    "name" : "ksqn291",
    "__v" : 0,
    "_id" : ObjectId("540f346c3e7fc1054ffa7086"),
    "channel" : "Sales"
}

很多谢谢!


当前回答

另一种选择是使用$sortByCount阶段。

db.collection.aggregate([
  { $sortByCount: '$name' }
]

这是$group & $sort的组合。

$sortByCount阶段相当于以下$group + $sort序列: {$组:{_id: <表达式>,数:{$金额:1}}}, {$sort: {count: -1}}

其他回答

这就是我们如何在mongoDB compass中实现这一点

在名称上使用聚合,并使用计数>获取名称1:

db.collection.aggregate([
    {"$group" : { "_id": "$name", "count": { "$sum": 1 } } },
    {"$match": {"_id" :{ "$ne" : null } , "count" : {"$gt": 1} } }, 
    {"$project": {"name" : "$_id", "_id" : 0} }
]);

按重复数从多到少对结果进行排序:

db.collection.aggregate([
    {"$group" : { "_id": "$name", "count": { "$sum": 1 } } },
    {"$match": {"_id" :{ "$ne" : null } , "count" : {"$gt": 1} } }, 
    {"$sort": {"count" : -1} },
    {"$project": {"name" : "$_id", "_id" : 0} }     
]);

要使用除“name”以外的其他列名,请将“$name”更改为“$column_name”

您可以使用以下聚合管道找到重复名称的列表:

将所有名称相似的记录分组。 匹配那些记录大于1的组。 然后再次分组,将所有重复的名称投影为一个数组。

代码:

db.collection.aggregate([
{$group:{"_id":"$name","name":{$first:"$name"},"count":{$sum:1}}},
{$match:{"count":{$gt:1}}},
{$project:{"name":1,"_id":0}},
{$group:{"_id":null,"duplicateNames":{$push:"$name"}}},
{$project:{"_id":0,"duplicateNames":1}}
])

o/p:

{ "duplicateNames" : [ "ksqn291", "ksqn29123213Test" ] }

如果你需要查看所有复制的行:

db.collection.aggregate([
     {"$group" : { "_id": "$name", "count": { "$sum": 1 },"data": { "$push": "$$ROOT" }}},
     {"$unwind": "$data"},
     {"$match": {"_id" :{ "$ne" : null } , "count" : {"$gt": 1} } }, 
]);

另一种选择是使用$sortByCount阶段。

db.collection.aggregate([
  { $sortByCount: '$name' }
]

这是$group & $sort的组合。

$sortByCount阶段相当于以下$group + $sort序列: {$组:{_id: <表达式>,数:{$金额:1}}}, {$sort: {count: -1}}