在Python中散列(隐藏)字符串

我需要的是哈希字符串。它不一定是安全的,因为它只是文本文件中的一个隐藏短语(不必为人眼所识别)。

它不应该只是一个随机字符串,因为当用户键入字符串时,我想对其进行哈希处理并将其与已经哈希的字符串(来自文本文件)进行比较。

为此目的最好的是什么?可以使用内置类吗?

回答:

首先,让我说您不能保证获得独特的结果。如果想要Universe中所有字符串的唯一结果,最好存储字符串本身(或压缩版本)。

一秒钟有更多内容。让我们先获取一些哈希值。

哈希库方式

您可以通过以下几个步骤使用任何主要的加密哈希来哈希字符串:

>>> import hashlib

>>> sha = hashlib.sha1("I am a cat")

>>> sha.hexdigest()

'576f38148ae68c924070538b45a8ef0f73ed8710'

就内置而言,您可以在SHA1,SHA224,SHA256,SHA384,SHA512和MD5之间选择。

这些哈希算法有什么区别?

哈希函数通过获取可变长度的数据并将其转换为固定长度的数据来工作。

对于内建的每种SHA算法,固定长度hashlib是名称中指定的位数(sha1为160位数)。如果您要确保两个字符串不会出现在同一存储桶中(相同的哈希值),请选择摘要较大(固定长度)的哈希。

按照排序的顺序,这些是您必须使用的摘要大小:

Algorithm  Digest Size (in bits)

md5 128

sha1 160

sha224 224

sha256 256

sha384 384

sha512 512

摘要越大,发生冲突的可能性就越小,前提是您的哈希函数值得您的关注。

等等,怎么样hash()

内置hash()函数返回整数,出于您概述的目的,整数也可能易于使用。虽然有问题。

>>> hash('moo')

6387157653034356308

  1. 如果您的程序要在不同的系统上运行,则不能确定hash会返回相同的结果。实际上,我正在使用64位Python在64位计算机上运行。这些值将与32位Python截然不同。

  2. 对于Python 3.3+,正如@gnibbler所指出的,hash()在运行之间是随机的。它可以运行一次,但是几乎绝对不能在程序的运行中运行(从您提到的文本文件中提取)。

为什么要hash()这样建造?好吧,内置哈希存在于一个特定的原因。哈希表/字典/查找表在内存中。不是用于加密,而是用于在运行时进行廉价查找。

以上是 在Python中散列(隐藏)字符串 的全部内容, 来源链接: utcz.com/qa/398643.html

回到顶部