我使用elasticsearch来索引我的文档。
是否有可能指示它只返回特定的字段,而不是它所存储的整个json文档?
我使用elasticsearch来索引我的文档。
是否有可能指示它只返回特定的字段,而不是它所存储的整个json文档?
当前回答
在Elasticsearch 5。X上述方法是不赞成的。 你可以使用_source方法,但是在某些情况下,存储一个字段是有意义的。例如,如果你有一个带有标题、日期和一个非常大的内容字段的文档,你可能只想检索标题和日期,而不必从一个大的_source字段中提取这些字段:
在这种情况下,你可以使用:
{
"size": $INT_NUM_OF_DOCS_TO_RETURN,
"stored_fields":[
"doc.headline",
"doc.text",
"doc.timestamp_utc"
],
"query":{
"bool":{
"must":{
"term":{
"doc.topic":"news_on_things"
}
},
"filter":{
"range":{
"doc.timestamp_utc":{
"gte":1451606400000,
"lt":1483228800000,
"format":"epoch_millis"
}
}
}
}
},
"aggs":{
}
}
有关如何为存储的字段建立索引,请参阅文档。 总是很高兴得到好评!
其他回答
在Elasticsearch 5。X上述方法是不赞成的。 你可以使用_source方法,但是在某些情况下,存储一个字段是有意义的。例如,如果你有一个带有标题、日期和一个非常大的内容字段的文档,你可能只想检索标题和日期,而不必从一个大的_source字段中提取这些字段:
在这种情况下,你可以使用:
{
"size": $INT_NUM_OF_DOCS_TO_RETURN,
"stored_fields":[
"doc.headline",
"doc.text",
"doc.timestamp_utc"
],
"query":{
"bool":{
"must":{
"term":{
"doc.topic":"news_on_things"
}
},
"filter":{
"range":{
"doc.timestamp_utc":{
"gte":1451606400000,
"lt":1483228800000,
"format":"epoch_millis"
}
}
}
}
},
"aggs":{
}
}
有关如何为存储的字段建立索引,请参阅文档。 总是很高兴得到好评!
有几种方法可以用于实现特定领域的结果。 可以通过源方法。 根据我们的兴趣,另一个方法filter_path也可以用来接收更清晰、更概括的答案:
索引"index1"中的文档Json:
"hits" : [
{
"_index" : "index1",
"_type" : "_doc",
"_id" : "1",
"_score" : 1,
"_source" : {
"year" : 2020,
"created_at" : "2020-01-29",
"url" : "www.github.com/mbarr0987",
"name":"github"
}
}
查询:
GET index1/_search?filter_path=hits.hits._source.url
{
"query": {
{"term": {"name":"github" }
}
}
}
输出:
{
"hits" : {
"hits" : [
{
"_source" : {
"url" : "www.github.com/mbarr0987"
}
}
]
}
}
例如,你有一个有三个字段的doc:
PUT movie/_doc/1
{
"name":"The Lion King",
"language":"English",
"score":"9.3"
}
如果你想返回名字和分数,你可以使用下面的命令:
GET movie/_doc/1?_source_includes=name,score
如果你想获得一些匹配模式的字段:
GET movie/_doc/1?_source_includes=*re
可能会排除一些字段:
GET movie/_doc/1?_source_excludes=score
是的,使用一个更好的选择源过滤器。如果你使用JSON进行搜索,它会是这样的:
{
"_source": ["user", "message", ...],
"query": ...,
"size": ...
}
在ES 2.4和更早的版本中,你也可以在搜索API中使用fields选项:
{
"fields": ["user", "message", ...],
"query": ...,
"size": ...
}
这在ES 5+中已弃用。而且源过滤器更强大!
是的,通过使用源过滤器你可以做到这一点,这里是文档源过滤器
示例请求
POST index_name/_search
{
"_source":["field1","filed2".....]
}
输出将是
{
"took": 57,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"skipped": 0,
"failed": 0
},
"hits": {
"total": 1,
"max_score": 1,
"hits": [
{
"_index": "index_name",
"_type": "index1",
"_id": "1",
"_score": 1,
"_source": {
"field1": "a",
"field2": "b"
},
{
"field1": "c",
"field2": "d"
},....
}
]
}
}