Elasticsearch查询返回所有记录

我在Elasticsearch中有一个小数据库，出于测试目的，我想把所有记录拉回来。我正在尝试使用表单的URL…

http://localhost:9200/foo/_search?pretty=true&q={'matchAll':{''}}

有人能给我你要用来完成这个的URL吗?

当前回答

如果你想提取成千上万的记录，那么……少数人给出了使用“scroll”的正确答案(注意:一些人还建议使用“search_type=scan”。这已被弃用，并在v5.0中被移除。你不需要它)

从一个“search”查询开始，但指定一个“scroll”参数(这里我使用了1分钟的超时):

curl -XGET 'http://ip1:9200/myindex/_search?scroll=1m' -d '
{
    "query": {
            "match_all" : {}
    }
}
'

这包括你的第一批热门作品。但这还没完。上面curl命令的输出是这样的:

{"_scroll_id":"c2Nhbjs1OzUyNjE6NU4tU3BrWi1UWkNIWVNBZW43bXV3Zzs1Mzc3OkhUQ0g3VGllU2FhemJVNlM5d2t0alE7NTI2Mjo1Ti1TcGtaLVRaQ0hZU0FlbjdtdXdnOzUzNzg6SFRDSDdUaWVTYWF6YlU2Uzl3a3RqUTs1MjYzOjVOLVNwa1otVFpDSFlTQWVuN211d2c7MTt0b3RhbF9oaXRzOjIyNjAxMzU3Ow==","took":109,"timed_out":false,"_shards":{"total":5,"successful":5,"failed":0},"hits":{"total":22601357,"max_score":0.0,"hits":[]}}

重要的是要有_scroll_id方便，接下来你应该运行以下命令:

    curl -XGET  'localhost:9200/_search/scroll'  -d'
    {
        "scroll" : "1m", 
        "scroll_id" : "c2Nhbjs2OzM0NDg1ODpzRlBLc0FXNlNyNm5JWUc1" 
    }
    '

然而，传递scroll_id并不是设计为手动完成的。最好的办法是编写代码来实现它。例如，在java中:

    private TransportClient client = null;
    private Settings settings = ImmutableSettings.settingsBuilder()
                  .put(CLUSTER_NAME,"cluster-test").build();
    private SearchResponse scrollResp  = null;

    this.client = new TransportClient(settings);
    this.client.addTransportAddress(new InetSocketTransportAddress("ip", port));

    QueryBuilder queryBuilder = QueryBuilders.matchAllQuery();
    scrollResp = client.prepareSearch(index).setSearchType(SearchType.SCAN)
                 .setScroll(new TimeValue(60000))                            
                 .setQuery(queryBuilder)
                 .setSize(100).execute().actionGet();

    scrollResp = client.prepareSearchScroll(scrollResp.getScrollId())
                .setScroll(new TimeValue(timeVal))
                .execute()
                .actionGet();

现在在最后一个命令上使用LOOP来提取数据。

2016-02-11 07:13:24

其他回答

http://localhost:9200/foo/_search/?size=1000&pretty=1

您需要指定大小查询参数，因为默认值是10

2017-04-21 10:03:22

elasticsearch(ES)既支持GET请求，也支持POST请求，以便从ES集群索引中获取数据。

当我们执行GET操作时:

http://localhost:9200/[your index name]/_search?size=[no of records you want]&q=*:*

当我们做POST时:

http://localhost:9200/[your_index_name]/_search
{
  "size": [your value] //default 10
  "from": [your start index] //default 0
  "query":
   {
    "match_all": {}
   }
}

我建议使用elasticsearch http://mobz.github.io/elasticsearch-head/的UI插件这将帮助您更好地了解您创建的索引，并测试您的索引。

2015-09-28 21:31:46

简单!你可以使用size和from参数!

http://localhost:9200/[your index name]/_search?size=1000&from=0

然后逐渐改变，直到你得到所有的数据。

2015-12-14 10:29:43

使用server:9200/_stats也可以获得所有别名的统计信息。就像每个别名的大小和元素数量一样，这非常有用，并提供了有用的信息

2014-08-18 13:21:16

这是完成你想要的查询， (我建议使用Kibana，因为它有助于更好地理解查询)

GET my_index_name/my_type_name/_search
{
   "query":{
      "match_all":{}
   },
   size : 20,
   from : 3
}

要获得所有的记录，你必须使用“match_all”查询。

Size是你想要获取的记录的数目(一种限制)。默认情况下，ES只返回10条记录

从就像跳过，跳过前3个记录。

如果您想获取所有的记录，只需使用“total”字段的值一旦你从Kibana命中这个查询的结果，并使用“大小”。

2019-06-01 15:14:38

Elasticsearch查询返回所有记录

推荐文章

最新文章

标签