经典检索算法:BM25

- 思路比较简单,主要就是计算一个query里面所有词和文档的相关度,
 - 然后在把分数做累加操作
 - 而每个词的相关度分数主要还是受到tf/idf的影响
 
其实就是套用一个数学公式
- 详见:https://my.oschina.net/u/3847203/blog/2996346
 - 直接套用叫二值独立模型
 - 单词加权叫 BM25 模型
 - 考虑不同区域的权重差异 叫BM25F模型 
- 不同区域,比如标题、摘要
 
 
以上是 经典检索算法:BM25 的全部内容, 来源链接: utcz.com/z/512880.html




