使elasticsearch只返回某些字段?

我使用elasticsearch来索引我的文档。

是否有可能指示它只返回特定的字段，而不是它所存储的整个json文档?

当前回答

在Elasticsearch 5。X上述方法是不赞成的。你可以使用_source方法，但是在某些情况下，存储一个字段是有意义的。例如，如果你有一个带有标题、日期和一个非常大的内容字段的文档，你可能只想检索标题和日期，而不必从一个大的_source字段中提取这些字段:

在这种情况下，你可以使用:

{  
   "size": $INT_NUM_OF_DOCS_TO_RETURN,
   "stored_fields":[  
      "doc.headline",
      "doc.text",
      "doc.timestamp_utc"
   ],
   "query":{  
      "bool":{  
         "must":{  
            "term":{  
               "doc.topic":"news_on_things"
            }
         },
         "filter":{  
            "range":{  
               "doc.timestamp_utc":{  
                  "gte":1451606400000,
                  "lt":1483228800000,
                  "format":"epoch_millis"
               }
            }
         }
      }
   },
   "aggs":{  

   }
}

有关如何为存储的字段建立索引，请参阅文档。总是很高兴得到好评!

2017-03-29 14:57:31

其他回答

如果你懂sql，请写一个查询来获取代码的值，例如sql查询等价和elasticsearch查询

POST /_sql/translate
{
  
  "query": "select name,surname from users"
}

结果是，请仔细查看includes键

{
  "size" : 1000,
  "_source" : {
    "includes" : [
      "name",
      "surname"
    ],
    "excludes" : [ ]
  },
  "sort" : [
    {
      "_doc" : {
        "order" : "asc"
      }
    }
  ]
}

2020-08-06 03:39:26

例如，你有一个有三个字段的doc:

PUT movie/_doc/1
{
  "name":"The Lion King",
  "language":"English",
  "score":"9.3"
}

如果你想返回名字和分数，你可以使用下面的命令:

GET movie/_doc/1?_source_includes=name,score

如果你想获得一些匹配模式的字段:

GET movie/_doc/1?_source_includes=*re

可能会排除一些字段:

GET movie/_doc/1?_source_excludes=score

2019-07-21 12:38:20

有几种方法可以用于实现特定领域的结果。可以通过源方法。根据我们的兴趣，另一个方法filter_path也可以用来接收更清晰、更概括的答案:

索引"index1"中的文档Json:

"hits" : [
  {
    "_index" : "index1",
    "_type" : "_doc",
    "_id" : "1",
    "_score" : 1,
    "_source" : {
      "year" : 2020,
      "created_at" : "2020-01-29",
      "url" : "www.github.com/mbarr0987",
      "name":"github"
    }
  }

查询:

GET index1/_search?filter_path=hits.hits._source.url
{
  "query": { 
        {"term": {"name":"github" }
    }
  }
}

输出:

{
  "hits" : {
    "hits" : [
      {
        "_source" : {
          "url" : "www.github.com/mbarr0987"
            }
          }
      ]
   }
}

2021-01-29 09:43:33

是的，通过使用源过滤器你可以做到这一点，这里是文档源过滤器

示例请求

POST index_name/_search
 {
   "_source":["field1","filed2".....] 
 }

输出将是

{
  "took": 57,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": 1,
    "max_score": 1,
    "hits": [
      {
        "_index": "index_name",
        "_type": "index1",
        "_id": "1",
        "_score": 1,
        "_source": {
          "field1": "a",
          "field2": "b"
        },
        {
          "field1": "c",
          "field2": "d"
        },....
      }
    ]
  }
}

2018-09-28 05:31:21

我发现get api的文档很有帮助——尤其是Source filtering和Fields: https://www.elastic.co/guide/en/elasticsearch/reference/7.3/docs-get.html#get-source-filtering这两个部分

他们阐述了源过滤:

如果您只需要完整_source中的一个或两个字段，则可以使用_source_include & _source_exclude参数来包含或过滤掉你需要的部分。这一点特别有用部分检索可以节省网络开销的大型文档

这非常适合我的用例。我最终只是像这样简单地过滤源代码(使用简写):

{
    "_source": ["field_x", ..., "field_y"],
    "query": {      
        ...
    }
}

供参考，他们在文档中声明了fields参数:

get操作允许指定一组存储字段通过传递fields参数返回。

它似乎是为了满足特定存储的字段，它将每个字段放在一个数组中。如果指定的字段还没有被存储，它将从_source中获取每个字段，这可能会导致“更慢”的检索。我也有麻烦试图让它返回类型对象的字段。

因此，总的来说，您有两个选择，要么通过源过滤，要么通过[存储]字段。

2014-12-04 15:22:07

使elasticsearch只返回某些字段?

推荐文章

最新文章

标签