Elasticsearch/ES教程（14）：搜索结果排序-我的文章分享

link管理

链接快照平台

相关文章推荐

狂野的荒野 · Caused by: ...· 1 周前 ·

痴情的墨镜 · 2024武汉网球公开赛开票啦！票价表_腾讯新闻· 6 月前 ·

紧张的烤面包 · 编译器错误 C3861 | ...· 8 月前 ·

耍酷的瀑布 · 413368 – Type Cannot ...· 10 月前 ·

飞奔的回锅肉 · Stata学习：如何构建双重差分机器学习模型 ...· 1 年前 ·

悲伤的足球 · Is compression/gzip ...· 1 年前 ·

默认情况下，ES的搜索结果是排序的，是按相关性倒序排列的———相关性最高的排在最前面。

那么什么是相关性，相关性如何计算？

每个文档都有相关性评分，用一个正浮点数字段 _score 来表示。 _score 的评分越高，相关性越高。

查询语句会为每个文档生成一个 _score 字段。（评分的计算方式取决于查询类型不同的查询语句用于不同的目的，这里不详细介绍。）

Elasticsearch 的相似度算法被定义为检索词频率/反向文档频率， TF/IDF ，包括以下内容：

检索词频率

检索词在该字段出现的频率？出现频率越高，相关性也越高。字段中出现过 5 次要比只出现过 1 次的相关性高。

反向文档频率

每个检索词在索引中出现的频率？频率越高，相关性越低。检索词出现在多数文档中会比出现在少数文档中的权重更低。常用词如 and 或 the 对相关度贡献很少，因为它们在多数文档中都会出现。

字段长度准则

字段的长度是多少？长度越长，相关性越低。检索词出现在一个短的 title 要比同样的词出现在一个长的 content 字段权重更大。

排序默认方式是根据算分score来排序
可排序的字段有

keyword

数值

地理坐标

日期

GET /indexName/_search
    query: {
        match_all: {}
    sort:[
        {"FIELD": "desc"}

推荐文章

狂野的荒野 · Caused by: io.netty.channel.AbstractChannel$AnnotatedConnectException: Connection refused: no furthe

1 周前

痴情的墨镜 · 2024武汉网球公开赛开票啦！票价表_腾讯新闻

6 月前

紧张的烤面包 · 编译器错误 C3861 | Microsoft Learn

8 月前

耍酷的瀑布 · 413368 – Type Cannot switch on a value of type ... Only convertible int values, strings or enum vari

10 月前

飞奔的回锅肉 · Stata学习：如何构建双重差分机器学习模型？ddml - 知乎

1 年前

悲伤的足球 · Is compression/gzip possible with Windows Plesk/IIS? | Plesk Forum

1 年前