使用python获取Redis数据库中的所有键
有一篇关于Redis命令以获取所有可用键的文章,但我想使用Python做到这一点。
有什么办法吗?
回答:
采用 scan_iter()
scan_iter()
优于keys()
大量密钥,因为它为您提供了可以使用的迭代器,而不是尝试将所有密钥加载到内存中。
我的redis中有一个1B记录,而且我永远都无法获得足够的内存来一次返回所有密钥。
这是一个python代码段,scan_iter()
用于从商店中获取与某个模式匹配的所有键,并一一删除它们:
import redisr = redis.StrictRedis(host='localhost', port=6379, db=0)
for key in r.scan_iter("user:*"):
# delete the key
r.delete(key)
如果要扫描的密钥列表非常大(例如,大于100k的密钥),则分批扫描它们将更加高效,如下所示:
import redisfrom itertools import izip_longest
r = redis.StrictRedis(host='localhost', port=6379, db=0)
# iterate a list in batches of size n
def batcher(iterable, n):
args = [iter(iterable)] * n
return izip_longest(*args)
# in batches of 500 delete keys matching user:*
for keybatch in batcher(r.scan_iter('user:*'),500):
r.delete(*keybatch)
我对该脚本进行了基准测试,发现使用500个批处理的规模比一对一扫描密钥快5倍。我测试了不同的批次大小(3,50,500,1000,5000),发现500的批次大小似乎是最佳的。
请注意,无论您使用scan_iter()
or keys()
方法,该操作都不是原子操作,并且可能会部分失败。
我不建议在其他地方重复此示例。对于unicode键,它将失败,并且即使中等数量的键,其速度也非常慢:
redis-cli --raw keys "user:*"| xargs redis-cli del
在此示例中,xargs为每个密钥创建一个新的redis-cli进程!那很糟。
我将这种方法的基准测试结果比第一个python示例慢了4倍,在第一个python示例中,它删除了每个键一次,比批量删除500个要慢20倍。
以上是 使用python获取Redis数据库中的所有键 的全部内容, 来源链接: utcz.com/qa/427438.html