我看不到任何关于何时应该使用查询或过滤器或两者的某种组合的描述。它们之间的区别是什么?有人能解释一下吗?
当前回答
过滤器->这个文档匹配吗?是或否的二元答案
查询->这个文档匹配吗?匹配度如何?使用得分
其他回答
除此之外,很少有其他的。 首先应用筛选器,然后对其结果处理查询。为了存储每个文档的二进制真/假匹配,使用了bitSet数组。 这个BitSet数组在内存中,它将在第二次查询过滤器时使用。这样,使用bitset数组数据结构,我们就能够利用缓存的结果。
这里还有一点需要注意,过滤器缓存仅在执行请求时创建,因此只有从第二次命中开始,我们才真正获得缓存的优势。
但你可以使用更温暖的API来解决这个问题。当你在一个更温暖的API上用过滤器注册一个查询时,它将确保在一个新的段出现时对它执行。因此,我们将从第一次执行本身获得一致的速度。
基本上,当您想要使用评分对文档执行搜索时,将使用查询。 过滤器用于缩小使用查询获得的结果集。过滤器是布尔型的。
例如,假设您有一个餐馆索引,例如zomato。 现在你想搜索提供“披萨”的餐厅,这基本上就是你的搜索关键词。
因此,您将使用查询来查找所有包含“pizza”的文档,并将获得一些结果。
假设现在你想要一个提供披萨且评分至少为4.0的餐厅名单。
所以你要做的就是在你的查询中使用关键字“比萨饼”,并应用过滤器评级为4.0。
实际情况是,过滤器通常应用于通过查询索引获得的结果。
过滤器->这个文档匹配吗?是或否的二元答案
查询->这个文档匹配吗?匹配度如何?使用得分
自Elasticsearch版本2以来,过滤器和查询已经合并,任何查询子句都可以用作过滤器或查询(取决于上下文)。与版本1一样,过滤器是缓存的,如果评分不重要,就应该使用它。
来源:https://logz.io/blog/elasticsearch-queries/
官方文件是这么说的:
作为一般规则,应该使用过滤器而不是查询: 用于二进制是/否搜索 用于查询确切的值
作为一般规则,应该使用查询而不是过滤器: 全文检索 结果取决于相关性评分
推荐文章
- Elasticsearch:最大虚拟内存区域。Max_map_count[65530]太低,至少增加到[262144]
- 查询与过滤器
- Elasticsearch中MUST和SHOULD bool查询的区别
- 将must和OR结合起来查询
- Elasticsearch error: cluster_block_exception [FORBIDDEN/12/index read-only / allow delete (api)], flood stage disk watermark exceeded .日志含义
- 列出ElasticSearch服务器上的所有索引?
- Elasticsearch中的碎片和副本
- ElasticSearch, Sphinx, Lucene, Solr, Xapian。哪种适合哪种用途?
- 从ElasticSearch中删除数据
- 使elasticsearch只返回某些字段?
- Elasticsearch查询返回所有记录
- Solr vs. ElasticSearch