我想执行以下查询:
db.mycollection.find(HAS IMAGE URL)
正确的语法应该是什么?
我想执行以下查询:
db.mycollection.find(HAS IMAGE URL)
正确的语法应该是什么?
当前回答
在pymongo中,你可以使用:
db.mycollection.find({"IMAGE URL":{"$ne":None}});
因为pymongo将mongo null表示为python None。
其他回答
db.collection_name.find({"filed_name":{$exists:true}});
获取包含此filed_name的文档,即使它是空的。
警告
db.collection_name.find({"filed_name":{$ne:null}});
获取文档,它的field_name有一个值$ne到null,但这个值也可以是空字符串。
我的建议:
db.collection_name.find({ "field_name":{$ne:null},$where:"this.field_name.length >0"})
有一句话是最好的:
db.mycollection.find({ 'fieldname' : { $exists: true, $ne: null } });
在这里,
我的收藏:放置你想要的收藏名称
Fieldname:放置你想要的字段名
解释:
$exists:当为true时,$exists匹配包含该字段的文档,包括字段值为空的文档。如果为false,则查询只返回不包含该字段的文档。
$ne选择字段值不等于指定值的文档。这包括不包含该字段的文档。
所以在你提供的情况下,下面的查询将返回所有imageurl字段存在且非空值的文档:
db.mycollection.find({ 'imageurl' : { $exists: true, $ne: null } });
另一种没有提到的替代方法是使用稀疏索引(仅当字段中有内容时,索引中的条目才存在),但对某些人来说可能是更有效的选择(不适用NULL条目)。下面是一个示例数据集:
db.foo.find()
{ "_id" : ObjectId("544540b31b5cf91c4893eb94"), "imageUrl" : "http://example.com/foo.jpg" }
{ "_id" : ObjectId("544540ba1b5cf91c4893eb95"), "imageUrl" : "http://example.com/bar.jpg" }
{ "_id" : ObjectId("544540c51b5cf91c4893eb96"), "imageUrl" : "http://example.com/foo.png" }
{ "_id" : ObjectId("544540c91b5cf91c4893eb97"), "imageUrl" : "http://example.com/bar.png" }
{ "_id" : ObjectId("544540ed1b5cf91c4893eb98"), "otherField" : 1 }
{ "_id" : ObjectId("544540f11b5cf91c4893eb99"), "otherField" : 2 }
现在,在imageUrl字段上创建稀疏索引:
db.foo.ensureIndex( { "imageUrl": 1 }, { sparse: true } )
{
"createdCollectionAutomatically" : false,
"numIndexesBefore" : 1,
"numIndexesAfter" : 2,
"ok" : 1
}
现在,MongoDB总是有可能使用表扫描而不是使用索引(特别是对于像我的示例这样的小数据集),即使对于潜在的覆盖索引查询也是如此。事实证明,这给了我一个简单的方法来说明这里的区别:
db.foo.find({}, {_id : 0, imageUrl : 1})
{ "imageUrl" : "http://example.com/foo.jpg" }
{ "imageUrl" : "http://example.com/bar.jpg" }
{ "imageUrl" : "http://example.com/foo.png" }
{ "imageUrl" : "http://example.com/bar.png" }
{ }
{ }
没有imageUrl的额外文档会被返回,只是空的,不是我们想要的。为了确认原因,做一个解释:
db.foo.find({}, {_id : 0, imageUrl : 1}).explain()
{
"cursor" : "BasicCursor",
"isMultiKey" : false,
"n" : 6,
"nscannedObjects" : 6,
"nscanned" : 6,
"nscannedObjectsAllPlans" : 6,
"nscannedAllPlans" : 6,
"scanAndOrder" : false,
"indexOnly" : false,
"nYields" : 0,
"nChunkSkips" : 0,
"millis" : 0,
"server" : "localhost:31100",
"filterSet" : false
}
所以,是的,一个BasicCursor等于一个表扫描,它没有使用索引。让我们用hint()强制查询使用稀疏索引:
db.foo.find({}, {_id : 0, imageUrl : 1}).hint({imageUrl : 1})
{ "imageUrl" : "http://example.com/bar.jpg" }
{ "imageUrl" : "http://example.com/bar.png" }
{ "imageUrl" : "http://example.com/foo.jpg" }
{ "imageUrl" : "http://example.com/foo.png" }
这就是我们正在寻找的结果——只返回填充了字段的文档。这也只使用索引(即它是一个覆盖索引查询),所以只有索引需要在内存中返回结果。
这是一个专门的用例,不能一般地使用(有关这些选项,请参阅其他答案)。特别需要注意的是,在目前情况下,您不能以这种方式使用count()(以我的例子为例,它将返回6而不是4),因此请仅在适当的时候使用。
分享给未来的读者。
这个查询为我们工作(查询从MongoDB compass执行):
{
"fieldName": {
"$nin": [
"",
null
]
}
}
db.<collectionName>.find({"IMAGE URL":{"$exists":"true"}, "IMAGE URL": {$ne: null}})