Java中的相似字符串比较

我想将多个字符串相互比较,并找到最相似的字符串。我想知道是否有任何库,方法或最佳实践会返回我哪些字符串与其他字符串更相似的字符串。例如:

  • “The quick fox jumped” -> “The fox jumped”
  • “The quick fox jumped” -> “The fox”

该比较将返回第一个比第二个更相似。

我想我需要一些方法,例如:

double similarityIndex(String s1, String s2)

某处有这样的东西吗?

编辑:为什么我要这样做?我正在编写一个脚本,用于将MS Project文件的输出与处理任务的某些旧系统的输出进行比较。由于传统系统的字段宽度非常有限,因此在添加值时将省略描述。我想要一些半自动的方法来查找MS Project中的哪些条目与系统上的条目相似,以便获得生成的密钥。它有缺点,因为它仍然必须手动检查,但是这样可以节省很多工作

回答:

是的,有许多文献证明的算法,例如:

  • Cosine similarity
  • Jaccard similarity
  • Dice’s coefficient
  • Matching similarity
  • Overlap similarity
  • etc etc

以上是 Java中的相似字符串比较 的全部内容, 来源链接: utcz.com/qa/420957.html

回到顶部