我试图在查询我的mongoDB时使用排序功能,但它失败了。同样的查询在MongoDB控制台中有效,但在这里无效。代码如下:

import pymongo

from  pymongo import Connection
connection = Connection()
db = connection.myDB
print db.posts.count()
for post in db.posts.find({}, {'entities.user_mentions.screen_name':1}).sort({u'entities.user_mentions.screen_name':1}):
    print post

我得到的错误如下:

Traceback (most recent call last):
  File "find_ow.py", line 7, in <module>
    for post in db.posts.find({}, {'entities.user_mentions.screen_name':1}).sort({'entities.user_mentions.screen_name':1},1):
  File "/Library/Python/2.6/site-packages/pymongo-2.0.1-py2.6-macosx-10.6-universal.egg/pymongo/cursor.py", line 430, in sort
  File "/Library/Python/2.6/site-packages/pymongo-2.0.1-py2.6-macosx-10.6-universal.egg/pymongo/helpers.py", line 67, in _index_document
TypeError: first item in each key pair must be a string

我在其他地方找到了一个链接,说如果使用pymongo,我需要在键的前面放置一个“u”,但这也不起作用。还有谁能搞定这个吗,还是这是个bug。


当前回答

为什么python使用元组列表而不是dict?

在python中,不能保证字典将按照您声明的顺序进行解释。

因此,在mongo shell中,您可以执行.sort({'field1':1,'field2':1}),解释器将在第一级对field1进行排序,在第二级对fiel2进行排序。

如果在python中使用此语法,则有可能在第一级按field2排序。使用tuple,就没有这种风险。

.sort([("field1",pymongo.ASCENDING), ("field2",pymongo.DESCENDING)])

其他回答

为什么python使用元组列表而不是dict?

在python中,不能保证字典将按照您声明的顺序进行解释。

因此,在mongo shell中,您可以执行.sort({'field1':1,'field2':1}),解释器将在第一级对field1进行排序,在第二级对fiel2进行排序。

如果在python中使用此语法,则有可能在第一级按field2排序。使用tuple,就没有这种风险。

.sort([("field1",pymongo.ASCENDING), ("field2",pymongo.DESCENDING)])

这也是可行的:

db.Account.find().sort('UserName', -1)
db.Account.find().sort('UserName', 1)

我在我的代码中使用这个,如果我在这里做错了,请评论,谢谢。

.sort()在pymongo中以键和方向作为参数。

如果你想通过id来排序那么你可以输入。sort("_id", 1)

对于多个字段:

.sort([("field1", pymongo.ASCENDING), ("field2", pymongo.DESCENDING)])

比如说,你想要根据'created_on'字段排序,然后你可以这样做,

.sort('{}'.format('created_on'), 1 if sort_type == 'asc' else -1)

TLDR:与传统的.find().sort()相比,聚合管道更快。

现在来看看真正的解释。在MongoDB中执行排序操作有两种方式:

使用.find()和.sort()。 或者使用聚合管道。

正如许多人建议的那样,.find().sort()是执行排序的最简单方法。

.sort([("field1",pymongo.ASCENDING), ("field2",pymongo.DESCENDING)])

但是,与聚合管道相比,这是一个缓慢的过程。

接下来是聚合管道方法。实现用于排序的简单聚合管道的步骤如下:

$match(可选步骤) 美元的排序

注意:根据我的经验,聚合管道的工作速度比.find().sort()方法快一些。

下面是聚合管道的一个示例。

db.collection_name.aggregate([{
    "$match": {
        # your query - optional step
    }
},
{
    "$sort": {
        "field_1": pymongo.ASCENDING,
        "field_2": pymongo.DESCENDING,
        ....
    }
}])

你自己试试这个方法,比较一下速度,然后在评论中告诉我。

编辑:在对多个字段排序时,不要忘记使用allowDiskUse=True,否则它将抛出一个错误。