经典检索算法:BM25

编程

  • 思路比较简单,主要就是计算一个query里面所有词和文档的相关度,
  • 然后在把分数做累加操作
  • 而每个词的相关度分数主要还是受到tf/idf的影响

其实就是套用一个数学公式

  • 详见:https://my.oschina.net/u/3847203/blog/2996346
  • 直接套用叫二值独立模型
  • 单词加权叫 BM25 模型
  • 考虑不同区域的权重差异 叫BM25F模型

    • 不同区域,比如标题、摘要

以上是 经典检索算法:BM25 的全部内容, 来源链接: utcz.com/z/512880.html

回到顶部