经典检索算法：BM25

Z时代
2024-01-10
分类：综合

思路比较简单，主要就是计算一个query里面所有词和文档的相关度，

然后在把分数做累加操作

而每个词的相关度分数主要还是受到tf/idf的影响

其实就是套用一个数学公式

详见：https://my.oschina.net/u/3847203/blog/2996346

直接套用叫二值独立模型

单词加权叫 BM25 模型

考虑不同区域的权重差异叫BM25F模型
- 不同区域，比如标题、摘要

以上是经典检索算法：BM25 的全部内容，来源链接： utcz.com/z/512880.html

回到顶部