在MongoDB中,是否可以使用来自另一个字段的值更新一个字段的值?等价的SQL是这样的:

UPDATE Person SET Name = FirstName + ' ' + LastName

MongoDB的伪代码是:

db.person.update( {}, { $set : { name : firstName + ' ' + lastName } );

当前回答

我尝试了上面的解决方案,但我发现它不适合大量数据。然后我发现了流的特性:

MongoClient.connect("...", function(err, db){
    var c = db.collection('yourCollection');
    var s = c.find({/* your query */}).stream();
    s.on('data', function(doc){
        c.update({_id: doc._id}, {$set: {name : doc.firstName + ' ' + doc.lastName}}, function(err, result) { /* result == true? */} }
    });
    s.on('end', function(){
        // stream can end before all your updates do if you have a lot
    })
})

其他回答

Update()方法将聚合管道作为参数,如

db.collection_name.update(
  {
    // Query
  },
  [
    // Aggregation pipeline
    { "$set": { "id": "$_id" } }
  ],
  {
    // Options
    "multi": true // false when a single doc has to be updated
  }
)

可以使用聚合管道使用现有值设置或取消设置字段。

注意:使用带字段名的$来指定要读取的字段。

显然,自从MongoDB 3.4以来,有一种方法可以有效地做到这一点,请参阅styvane的答案。


过时的答案如下

您还不能在更新中引用文档本身。您需要遍历文档并使用函数更新每个文档。请参阅下面的示例,或者服务器端eval()的示例。

你应该迭代。针对您的具体情况:

db.person.find().snapshot().forEach(
    function (elem) {
        db.person.update(
            {
                _id: elem._id
            },
            {
                $set: {
                    name: elem.firstname + ' ' + elem.lastname
                }
            }
        );
    }
);

下面是我们针对~150_000条记录将一个字段复制到另一个字段的方法。它花了大约6分钟,但与实例化和遍历相同数量的ruby对象相比,仍然明显减少了资源消耗。

js_query = %({
  $or : [
    {
      'settings.mobile_notifications' : { $exists : false },
      'settings.mobile_admin_notifications' : { $exists : false }
    }
  ]
})

js_for_each = %(function(user) {
  if (!user.settings.hasOwnProperty('mobile_notifications')) {
    user.settings.mobile_notifications = user.settings.email_notifications;
  }
  if (!user.settings.hasOwnProperty('mobile_admin_notifications')) {
    user.settings.mobile_admin_notifications = user.settings.email_admin_notifications;
  }
  db.users.save(user);
})

js = "db.users.find(#{js_query}).forEach(#{js_for_each});"
Mongoid::Sessions.default.command('$eval' => js)

最好的方法是在4.2+版本中,它允许在更新文档中使用聚合管道和updateOne、updateMany或update(在大多数语言驱动程序中已弃用,如果不是所有语言驱动程序)收集方法。

MongoDB 4.2 +

4.2版还引入了$set管道阶段操作符,它是$addFields的别名。我将在这里使用$set,因为它与我们试图实现的目标相映射。

db.collection.<update method>(
    {},
    [
        {"$set": {"name": { "$concat": ["$firstName", " ", "$lastName"]}}}
    ]
)

请注意,该方法的第二个参数中的方括号指定了一个聚合管道,而不是一个普通的更新文档,因为使用简单的文档将无法正确工作。

MongoDB 3.4 +

在3.4+中,您可以使用$addFields和$out聚合管道操作符。

db.collection.aggregate(
    [
        { "$addFields": { 
            "name": { "$concat": [ "$firstName", " ", "$lastName" ] } 
        }},
        { "$out": <output collection name> }
    ]
)

注意,这不会更新您的集合,而是替换现有的集合或创建一个新的集合。此外,对于需要“类型转换”的更新操作,您将需要客户端处理,并且根据操作的不同,您可能需要使用find()方法而不是.aggreate()方法。

MongoDB 3.2和3.0

这样做的方法是通过$ projection我们的文档,并使用$concat字符串聚合操作符返回连接的字符串。 然后迭代游标并使用$set更新操作符将新字段添加到文档中,使用批量操作以获得最大效率。

聚合查询:

var cursor = db.collection.aggregate([ 
    { "$project":  { 
        "name": { "$concat": [ "$firstName", " ", "$lastName" ] } 
    }}
])

MongoDB 3.2或更新版本

您需要使用bulkWrite方法。

var requests = [];
cursor.forEach(document => { 
    requests.push( { 
        'updateOne': {
            'filter': { '_id': document._id },
            'update': { '$set': { 'name': document.name } }
        }
    });
    if (requests.length === 500) {
        //Execute per 500 operations and re-init
        db.collection.bulkWrite(requests);
        requests = [];
    }
});

if(requests.length > 0) {
     db.collection.bulkWrite(requests);
}

MongoDB 2.6和3.0

从这个版本开始,您需要使用现在已弃用的Bulk API及其相关方法。

var bulk = db.collection.initializeUnorderedBulkOp();
var count = 0;

cursor.snapshot().forEach(function(document) { 
    bulk.find({ '_id': document._id }).updateOne( {
        '$set': { 'name': document.name }
    });
    count++;
    if(count%500 === 0) {
        // Excecute per 500 operations and re-init
        bulk.execute();
        bulk = db.collection.initializeUnorderedBulkOp();
    }
})

// clean up queues
if(count > 0) {
    bulk.execute();
}

MongoDB 2.4

cursor["result"].forEach(function(document) {
    db.collection.update(
        { "_id": document._id }, 
        { "$set": { "name": document.name } }
    );
})