我玩周围的MongoDB试图弄清楚如何做一个简单的
SELECT province, COUNT(*) FROM contest GROUP BY province
但是我似乎不能用聚合函数来算出来。我可以用一些奇怪的组语法来做
db.user.group({
"key": {
"province": true
},
"initial": {
"count": 0
},
"reduce": function(obj, prev) {
if (true != null) if (true instanceof Array) prev.count += true.length;
else prev.count++;
}
});
但是是否有更简单/更快的方法使用聚合函数?
db.contest.aggregate([
{ $match:{.....May be some match criteria...}},
{ $project: {"province":1,_id:0}},
{ $sortByCount: "$province" }
],{allowDiskUse:true});
MongoDB对内存的排序操作有32mb的限制,使用allowDiskUse: true这个选项,当你在数百万数据之前公开这个查询时,它将在磁盘级别而不是内存级别进行排序。MongoDB聚合管道有100MB的限制,因此使用$project来减少流向下一个管道的数据。
如果您使用的是小数据,那么不需要使用allowDiskUse选项。
根据聚合函数的结果,我需要做一些额外的操作。最后,基于MongoDB中的结果,对聚合函数和操作找到了一些解决方案。我有一个集合请求字段请求,来源,状态,requestDate。
单字段组按&计数:
db.Request.aggregate([
{"$group" : {_id:"$source", count:{$sum:1}}}
])
多个字段按计数分组:
db.Request.aggregate([
{"$group" : {_id:{source:"$source",status:"$status"}, count:{$sum:1}}}
])
多个字段分组&计数使用字段排序:
db.Request.aggregate([
{"$group" : {_id:{source:"$source",status:"$status"}, count:{$sum:1}}},
{$sort:{"_id.source":1}}
])
多个字段按计数分组,使用计数排序:
db.Request.aggregate([
{"$group" : {_id:{source:"$source",status:"$status"}, count:{$sum:1}}},
{$sort:{"count":-1}}
])