我有两个不同的程序,希望分别在 Python 和 Java 中使用 Murmur3 哈希相同的字符串。
Python 版本 2.7.9:
mmh3.hash128('abc')
给出 79267961763742113019008347020647561319L。
Java 是 Guava 18.0:
HashCode hashCode = Hashing.murmur3_128().newHasher().putString("abc", StandardCharsets.UTF_8).hash();
给出字符串“6778ad3f3f3f96b4522dca264174a23b”,转换为 BigInteger 给出 137537073056680613988840834069010096699。
如何从两者得到相同的结果?
Thanks
以下是如何从两者获得相同的结果:
byte[] mm3_le = Hashing.murmur3_128().hashString("abc", UTF_8).asBytes();
byte[] mm3_be = Bytes.toArray(Lists.reverse(Bytes.asList(mm3_le)));
assertEquals("79267961763742113019008347020647561319",
new BigInteger(mm3_be).toString());
哈希码的字节需要被视为小端 but BigInteger
将字节解释为大端字节序。您可能正在使用new BigInteger(hex, 16)
来创建BigInteger
,但输出HashCode.toString()
实际上是一系列代表哈希字节的十六进制数字对,其顺序与返回的顺序相同asBytes()
(小端)。 (您还可以反转这些十六进制对以获得一个十六进制数,该十六进制数在传递给new BigInteger(reversedHex, 16)
).
我认为文档toString()
由于它引用“大端”的方式有点令人困惑;它实际上并不意味着该方法的输出是表示解释为大端字节序的字节的十六进制数字。
我们有一个开放的issue用于添加asBigInteger()
to HashCode
.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)