我使用elasticsearch来索引我的文档。
是否有可能指示它只返回特定的字段,而不是它所存储的整个json文档?
我使用elasticsearch来索引我的文档。
是否有可能指示它只返回特定的字段,而不是它所存储的整个json文档?
当前回答
我发现get api的文档很有帮助——尤其是Source filtering和Fields: https://www.elastic.co/guide/en/elasticsearch/reference/7.3/docs-get.html#get-source-filtering这两个部分
他们阐述了源过滤:
如果您只需要完整_source中的一个或两个字段,则可以 使用_source_include & _source_exclude参数来包含或 过滤掉你需要的部分。这一点特别有用 部分检索可以节省网络开销的大型文档
这非常适合我的用例。我最终只是像这样简单地过滤源代码(使用简写):
{
"_source": ["field_x", ..., "field_y"],
"query": {
...
}
}
供参考,他们在文档中声明了fields参数:
get操作允许指定一组存储字段 通过传递fields参数返回。
它似乎是为了满足特定存储的字段,它将每个字段放在一个数组中。如果指定的字段还没有被存储,它将从_source中获取每个字段,这可能会导致“更慢”的检索。我也有麻烦试图让它返回类型对象的字段。
因此,总的来说,您有两个选择,要么通过源过滤,要么通过[存储]字段。
其他回答
对于ES版本5。X及以上,你可以这样查询ES:
GET /.../...
{
"_source": {
"includes": [ "FIELD1", "FIELD2", "FIELD3" ... " ]
},
.
.
.
.
}
response_filtering
所有REST api都接受一个filter_path参数 减少elasticsearch返回的响应。此参数取 用点符号表示的以逗号分隔的过滤器列表。
https://stackoverflow.com/a/35647027/844700
REST API GET请求可以使用'_source'参数进行。
示例请求
http://localhost:9200/opt_pr/_search?q=SYMBOL:ITC AND OPTION_TYPE=CE AND TRADE_DATE=2017-02-10 AND EXPIRY_DATE=2017-02-23&_source=STRIKE_PRICE
响应
{
"took": 59,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"failed": 0
},
"hits": {
"total": 104,
"max_score": 7.3908954,
"hits": [
{
"_index": "opt_pr",
"_type": "opt_pr_r",
"_id": "AV3K4QTgNHl15Mv30uLc",
"_score": 7.3908954,
"_source": {
"STRIKE_PRICE": 160
}
},
{
"_index": "opt_pr",
"_type": "opt_pr_r",
"_id": "AV3K4QTgNHl15Mv30uLh",
"_score": 7.3908954,
"_source": {
"STRIKE_PRICE": 185
}
},
{
"_index": "opt_pr",
"_type": "opt_pr_r",
"_id": "AV3K4QTgNHl15Mv30uLi",
"_score": 7.3908954,
"_source": {
"STRIKE_PRICE": 190
}
},
{
"_index": "opt_pr",
"_type": "opt_pr_r",
"_id": "AV3K4QTgNHl15Mv30uLm",
"_score": 7.3908954,
"_source": {
"STRIKE_PRICE": 210
}
},
{
"_index": "opt_pr",
"_type": "opt_pr_r",
"_id": "AV3K4QTgNHl15Mv30uLp",
"_score": 7.3908954,
"_source": {
"STRIKE_PRICE": 225
}
},
{
"_index": "opt_pr",
"_type": "opt_pr_r",
"_id": "AV3K4QTgNHl15Mv30uLr",
"_score": 7.3908954,
"_source": {
"STRIKE_PRICE": 235
}
},
{
"_index": "opt_pr",
"_type": "opt_pr_r",
"_id": "AV3K4QTgNHl15Mv30uLw",
"_score": 7.3908954,
"_source": {
"STRIKE_PRICE": 260
}
},
{
"_index": "opt_pr",
"_type": "opt_pr_r",
"_id": "AV3K4QTgNHl15Mv30uL5",
"_score": 7.3908954,
"_source": {
"STRIKE_PRICE": 305
}
},
{
"_index": "opt_pr",
"_type": "opt_pr_r",
"_id": "AV3K4QTgNHl15Mv30uLd",
"_score": 7.381078,
"_source": {
"STRIKE_PRICE": 165
}
},
{
"_index": "opt_pr",
"_type": "opt_pr_r",
"_id": "AV3K4QTgNHl15Mv30uLy",
"_score": 7.381078,
"_source": {
"STRIKE_PRICE": 270
}
}
]
}
}
在java中,你可以这样使用setFetchSource:
client.prepareSearch(index).setTypes(type)
.setFetchSource(new String[] { "field1", "field2" }, null)
是的,使用一个更好的选择源过滤器。如果你使用JSON进行搜索,它会是这样的:
{
"_source": ["user", "message", ...],
"query": ...,
"size": ...
}
在ES 2.4和更早的版本中,你也可以在搜索API中使用fields选项:
{
"fields": ["user", "message", ...],
"query": ...,
"size": ...
}
这在ES 5+中已弃用。而且源过滤器更强大!