余弦相似度与Okapi BM25有何不同?

我正在使用Elasticsearch进行研究。我打算使用相似度" title="余弦相似度">余弦相似度,但我注意到它不可用,而我们将BM25作为默认评分功能。

有什么理由吗?余弦相似度是否不适用于查询文档?为什么选择BM25作为默认值?谢谢

回答:

长期的Elasticsearch使用TF /

IDF算法来查找查询中的相似性。但是以前的数字版本更有效地更改为BM25。您可以阅读文档中的信息。好的文章解释了什么是elasticsearch以及ES中的相似性。

您还可以为elasticsearch编写自定义算法。这里有一篇关于如何做的好文章。

以上是 余弦相似度与Okapi BM25有何不同? 的全部内容, 来源链接: utcz.com/qa/409227.html

回到顶部