Murmur3散列Python和Java实现之间的不同结果

我有两个不同的程序,分别希望在Python和Java中使用Murmur3散列相同的字符串。

Python版本2.7.9:

mmh3.hash128('abc')

给出79267961763742113019008347020647561319L。

Java是Guava 18.0:

HashCode hashCode = Hashing.murmur3_128().newHasher().putString("abc", StandardCharsets.UTF_8).hash();

给出字符串“

6778ad3f3f3f96b4522dca264174a23b”,转换为BigInterger给出137537073056680613988840834069010096699。

如何从两者中获得相同的结果?

谢谢

回答:

这是从这两者获得相同结果的方法:

byte[] mm3_le = Hashing.murmur3_128().hashString("abc", UTF_8).asBytes();

byte[] mm3_be = Bytes.toArray(Lists.reverse(Bytes.asList(mm3_le)));

assertEquals("79267961763742113019008347020647561319",

new BigInteger(mm3_be).toString());

哈希码的字节需要被视为 小端,BigInteger将字节解释为大端。大概是您new BigInteger(hex,

16)用来创建BigInteger,但是的输出HashCode.toString()实际上是一系列十六进制数字对,它们表示散列字节的顺序与它们返回的顺序相同asBytes()(小尾数)。(您还可以反转这些对的十六进制,以获取一个十六进制数,当传递给时,该十六进制数的确产生相同的结果new

BigInteger(reversedHex, 16))。

我认为的文档toString()有些混乱,因为它指的是“大端”。它实际上并不意味着该方法的输出是十六进制数字,表示被解释为大端字节的字节。

要添加到,我们还有一个未解决的问题。asBigInteger()``HashCode

以上是 Murmur3散列Python和Java实现之间的不同结果 的全部内容, 来源链接: utcz.com/qa/420084.html

回到顶部