我一直在mongodb中存储tweets,每个对象看起来是这样的:

{
"_id" : ObjectId("4c02c58de500fe1be1000005"),
"contributors" : null,
"text" : "Hello world",
"user" : {
    "following" : null,
    "followers_count" : 5,
    "utc_offset" : null,
    "location" : "",
    "profile_text_color" : "000000",
    "friends_count" : 11,
    "profile_link_color" : "0000ff",
    "verified" : false,
    "protected" : false,
    "url" : null,
    "contributors_enabled" : false,
    "created_at" : "Sun May 30 18:47:06 +0000 2010",
    "geo_enabled" : false,
    "profile_sidebar_border_color" : "87bc44",
    "statuses_count" : 13,
    "favourites_count" : 0,
    "description" : "",
    "notifications" : null,
    "profile_background_tile" : false,
    "lang" : "en",
    "id" : 149978111,
    "time_zone" : null,
    "profile_sidebar_fill_color" : "e0ff92"
},
"geo" : null,
"coordinates" : null,
"in_reply_to_user_id" : 149183152,
"place" : null,
"created_at" : "Sun May 30 20:07:35 +0000 2010",
"source" : "web",
"in_reply_to_status_id" : {
    "floatApprox" : 15061797850
},
"truncated" : false,
"favorited" : false,
"id" : {
    "floatApprox" : 15061838001
}

我怎么写一个查询,检查created_at和找到所有对象之间的18:47和19:00?我是否需要更新我的文档以使日期以特定的格式存储?


当前回答

Python和pymongo

在收集帖子中使用pymongo在Python中查找两个日期之间的对象(基于教程):

from_date = datetime.datetime(2010, 12, 31, 12, 30, 30, 125000)
to_date = datetime.datetime(2011, 12, 31, 12, 30, 30, 125000)

for post in posts.find({"date": {"$gte": from_date, "$lt": to_date}}):
    print(post)

其中{"$gte": from_date, "$lt": to_date}指定以日期时间为单位的范围。datetime类型。

其他回答

将日期转换为GMT时区,因为您正在将它们填充到Mongo中。这样就不会有时区问题了。然后,当您将数据拉出来表示时,只需在twitter/timezone字段上进行计算。

Scala: 使用joda DateTime和BSON语法(reactivmongo):

val queryDateRangeForOneField = (start: DateTime, end: DateTime) =>
    BSONDocument(
      "created_at" -> BSONDocument(
        "$gte" -> BSONDateTime(start.millisOfDay().withMinimumValue().getMillis), 
        "$lte" -> BSONDateTime(end.millisOfDay().withMaximumValue().getMillis)),
     )

where msofday ().withMinimumValue() for“2021-09-08T06:42:51.697Z”将会是“2021-09-08T00:00:00.000Z” 而且 在millisOfDay()。withMaximumValue() for“2021-09-08t6:42:51.697 z”将会是“2021-09-08T23:59:99.999Z”

db.collection.find({$and:
  [
    {date_time:{$gt:ISODate("2020-06-01T00:00:00.000Z")}},
     {date_time:{$lt:ISODate("2020-06-30T00:00:00.000Z")}}
   ]
 })

##In case you are making the query directly from your application ##

db.collection.find({$and:
   [
     {date_time:{$gt:"2020-06-01T00:00:00.000Z"}},
     {date_time:{$lt:"2020-06-30T00:00:00.000Z"}}
  ]

 })

以ISO日期格式保存created_at日期,然后使用$gte和$lte。

db.connection.find({
    created_at: {
        $gte: ISODate("2010-05-30T18:47:00.000Z"),
        $lte: ISODate("2010-05-30T19:00:00.000Z")
    }
})

MongoDB实际上将日期的millis存储为int(64),如http://bsonspec.org/#/specification所规定的那样

但是,当您检索日期时,可能会非常混乱,因为客户端驱动程序将实例化一个带有自己本地时区的日期对象。mongo控制台中的JavaScript驱动程序肯定会做到这一点。

所以,如果你关心你的时区,那么确保你知道当你拿回来的时候它应该是什么。这对于查询不应该有太大的影响,因为它仍然等同于相同的int(64),不管你的日期对象在哪个时区(我希望如此)。但我肯定会用实际的日期对象(而不是字符串)进行查询,并让驱动程序做它的事情。