Java中的相似字符串比较
我想将多个字符串相互比较,并找到最相似的字符串。我想知道是否有任何库,方法或最佳实践会返回我哪些字符串与其他字符串更相似的字符串。例如:
- “The quick fox jumped” -> “The fox jumped”
- “The quick fox jumped” -> “The fox”
该比较将返回第一个比第二个更相似。
我想我需要一些方法,例如:
double similarityIndex(String s1, String s2)
某处有这样的东西吗?
编辑:为什么我要这样做?我正在编写一个脚本,用于将MS Project文件的输出与处理任务的某些旧系统的输出进行比较。由于传统系统的字段宽度非常有限,因此在添加值时将省略描述。我想要一些半自动的方法来查找MS Project中的哪些条目与系统上的条目相似,以便获得生成的密钥。它有缺点,因为它仍然必须手动检查,但是这样可以节省很多工作
回答:
是的,有许多文献证明的算法,例如:
- Cosine similarity
- Jaccard similarity
- Dice’s coefficient
- Matching similarity
- Overlap similarity
- etc etc
以上是 Java中的相似字符串比较 的全部内容, 来源链接: utcz.com/qa/420957.html