我试图在查询我的mongoDB时使用排序功能,但它失败了。同样的查询在MongoDB控制台中有效,但在这里无效。代码如下:
import pymongo
from pymongo import Connection
connection = Connection()
db = connection.myDB
print db.posts.count()
for post in db.posts.find({}, {'entities.user_mentions.screen_name':1}).sort({u'entities.user_mentions.screen_name':1}):
print post
我得到的错误如下:
Traceback (most recent call last):
File "find_ow.py", line 7, in <module>
for post in db.posts.find({}, {'entities.user_mentions.screen_name':1}).sort({'entities.user_mentions.screen_name':1},1):
File "/Library/Python/2.6/site-packages/pymongo-2.0.1-py2.6-macosx-10.6-universal.egg/pymongo/cursor.py", line 430, in sort
File "/Library/Python/2.6/site-packages/pymongo-2.0.1-py2.6-macosx-10.6-universal.egg/pymongo/helpers.py", line 67, in _index_document
TypeError: first item in each key pair must be a string
我在其他地方找到了一个链接,说如果使用pymongo,我需要在键的前面放置一个“u”,但这也不起作用。还有谁能搞定这个吗,还是这是个bug。
为什么python使用元组列表而不是dict?
在python中,不能保证字典将按照您声明的顺序进行解释。
因此,在mongo shell中,您可以执行.sort({'field1':1,'field2':1}),解释器将在第一级对field1进行排序,在第二级对fiel2进行排序。
如果在python中使用此语法,则有可能在第一级按field2排序。使用tuple,就没有这种风险。
.sort([("field1",pymongo.ASCENDING), ("field2",pymongo.DESCENDING)])
为什么python使用元组列表而不是dict?
在python中,不能保证字典将按照您声明的顺序进行解释。
因此,在mongo shell中,您可以执行.sort({'field1':1,'field2':1}),解释器将在第一级对field1进行排序,在第二级对fiel2进行排序。
如果在python中使用此语法,则有可能在第一级按field2排序。使用tuple,就没有这种风险。
.sort([("field1",pymongo.ASCENDING), ("field2",pymongo.DESCENDING)])
TLDR:与传统的.find().sort()相比,聚合管道更快。
现在来看看真正的解释。在MongoDB中执行排序操作有两种方式:
使用.find()和.sort()。
或者使用聚合管道。
正如许多人建议的那样,.find().sort()是执行排序的最简单方法。
.sort([("field1",pymongo.ASCENDING), ("field2",pymongo.DESCENDING)])
但是,与聚合管道相比,这是一个缓慢的过程。
接下来是聚合管道方法。实现用于排序的简单聚合管道的步骤如下:
$match(可选步骤)
美元的排序
注意:根据我的经验,聚合管道的工作速度比.find().sort()方法快一些。
下面是聚合管道的一个示例。
db.collection_name.aggregate([{
"$match": {
# your query - optional step
}
},
{
"$sort": {
"field_1": pymongo.ASCENDING,
"field_2": pymongo.DESCENDING,
....
}
}])
你自己试试这个方法,比较一下速度,然后在评论中告诉我。
编辑:在对多个字段排序时,不要忘记使用allowDiskUse=True,否则它将抛出一个错误。