查询与过滤器

我看不到任何关于何时应该使用查询或过滤器或两者的某种组合的描述。它们之间的区别是什么?有人能解释一下吗?

当前回答

一个例子(你自己试试)

说索引myindex包含三个文档:

curl -XPOST localhost:9200/myindex/mytype  -d '{ "msg": "Hello world!" }'
curl -XPOST localhost:9200/myindex/mytype  -d '{ "msg": "Hello world! I am Sam." }'
curl -XPOST localhost:9200/myindex/mytype  -d '{ "msg": "Hi Stack Overflow!" }'

查询:文档与查询匹配的程度

查询hello sam(使用关键字must)

curl localhost:9200/myindex/_search?pretty  -d '
{
  "query": { "bool": { "must": { "match": { "msg": "hello sam" }}}}
}'

文档“Hello world!”I am Sam.”的得分比“Hello world!”高，因为前者与查询中的两个单词都匹配。对文档进行评分。

"hits" : [
   ...
     "_score" : 0.74487394,
     "_source" : {
       "name" : "Hello world! I am Sam."
     }
   ...
     "_score" : 0.22108285,
     "_source" : {
       "name" : "Hello world!"
     }
   ...

筛选:文档是否与查询匹配

过滤hello sam(使用关键字过滤器)

curl localhost:9200/myindex/_search?pretty  -d '
{
  "query": { "bool": { "filter": { "match": { "msg": "hello sam" }}}}
}'

返回包含hello或sam的文档。文档不记分。

"hits" : [
   ...
     "_score" : 0.0,
     "_source" : {
       "name" : "Hello world!"
     }
   ...
     "_score" : 0.0,
     "_source" : {
       "name" : "Hello world! I am Sam."
     }
   ...

除非您需要全文搜索或评分，否则首选过滤器，因为Elasticsearch将自动缓存频繁使用的过滤器，以提高性能。参见Elasticsearch:查询和过滤上下文。

2017-12-20 03:58:02

其他回答

区别很简单:过滤器被缓存，不影响分数，因此比查询快。看看这里。假设一个查询通常是用户键入的并且几乎不可预测的，而过滤器帮助用户缩小搜索结果，例如使用facet。

2013-01-30 09:37:07

查询:计算分数;因此，它们能够返回按相关性排序的结果。过滤器:不计算分数，使他们更快，更容易缓存。

2020-08-15 04:56:05

官方文件是这么说的:

作为一般规则，应该使用过滤器而不是查询: 用于二进制是/否搜索用于查询确切的值

作为一般规则，应该使用查询而不是过滤器: 全文检索结果取决于相关性评分

2014-08-10 13:48:24

基本上，当您想要使用评分对文档执行搜索时，将使用查询。过滤器用于缩小使用查询获得的结果集。过滤器是布尔型的。