我看不到任何关于何时应该使用查询或过滤器或两者的某种组合的描述。它们之间的区别是什么?有人能解释一下吗?


当前回答

除此之外,很少有其他的。 首先应用筛选器,然后对其结果处理查询。为了存储每个文档的二进制真/假匹配,使用了bitSet数组。 这个BitSet数组在内存中,它将在第二次查询过滤器时使用。这样,使用bitset数组数据结构,我们就能够利用缓存的结果。

这里还有一点需要注意,过滤器缓存仅在执行请求时创建,因此只有从第二次命中开始,我们才真正获得缓存的优势。

但你可以使用更温暖的API来解决这个问题。当你在一个更温暖的API上用过滤器注册一个查询时,它将确保在一个新的段出现时对它执行。因此,我们将从第一次执行本身获得一致的速度。

其他回答

区别很简单:过滤器被缓存,不影响分数,因此比查询快。看看这里。假设一个查询通常是用户键入的并且几乎不可预测的,而过滤器帮助用户缩小搜索结果,例如使用facet。

查询:计算分数;因此,它们能够返回按相关性排序的结果。 过滤器:不计算分数,使他们更快,更容易缓存。

除此之外,很少有其他的。 首先应用筛选器,然后对其结果处理查询。为了存储每个文档的二进制真/假匹配,使用了bitSet数组。 这个BitSet数组在内存中,它将在第二次查询过滤器时使用。这样,使用bitset数组数据结构,我们就能够利用缓存的结果。

这里还有一点需要注意,过滤器缓存仅在执行请求时创建,因此只有从第二次命中开始,我们才真正获得缓存的优势。

但你可以使用更温暖的API来解决这个问题。当你在一个更温暖的API上用过滤器注册一个查询时,它将确保在一个新的段出现时对它执行。因此,我们将从第一次执行本身获得一致的速度。

自Elasticsearch版本2以来,过滤器和查询已经合并,任何查询子句都可以用作过滤器或查询(取决于上下文)。与版本1一样,过滤器是缓存的,如果评分不重要,就应该使用它。

来源:https://logz.io/blog/elasticsearch-queries/

官方文件是这么说的:

作为一般规则,应该使用过滤器而不是查询: 用于二进制是/否搜索 用于查询确切的值


作为一般规则,应该使用查询而不是过滤器: 全文检索 结果取决于相关性评分