Python 3，从/向gzip文件读取/写入压缩的json对象

Z时代
2024-01-10
分类：问答

对于Python3，我遵循@MartijnPieters的代码：

import gzip
import json
# writing
with gzip.GzipFile(jsonfilename, 'w') as fout:
    for i in range(N):
        uid = "whatever%i" % i
        dv = [1, 2, 3]
        data = json.dumps({
            'what': uid,
            'where': dv})
        fout.write(data + '\n')

但这会导致错误：

Traceback (most recent call last): ... File "C:\Users\Think\my_json.py", line 118, in write_json fout.write(data + '\n') File "C:\Users\Think\Anaconda3\lib\gzip.py", line 258, in write data = memoryview(data) TypeError: memoryview: a bytes-like object is required, not 'str'

有什么想法吗？

回答：

这里有四个转换步骤。

Python数据结构（嵌套字典，列表，字符串，数字，布尔值）

包含该数据结构（“ JSON”）的序列化表示形式的Python字符串

包含该字符串表示形式的字节列表（“ UTF-8”）

包含先前字节列表（“ gzip”）表示形式的字节列表

因此，让我们一步一步地采取这些步骤。

import gzip
import json
data = []
for i in range(N):
    uid = "whatever%i" % i
    dv = [1, 2, 3]
    data.append({
        'what': uid,
        'where': dv
    })                                           # 1. data
json_str = json.dumps(data) + "\n"               # 2. string (i.e. JSON)
json_bytes = json_str.encode('utf-8')            # 3. bytes (i.e. UTF-8)
with gzip.GzipFile(jsonfilename, 'w') as fout:   # 4. gzip
    fout.write(json_bytes)

注意，"\n"这里添加完全是多余的。它不会破坏任何东西，但是除此之外，它没有任何用处。我添加它只是因为您的代码示例中包含了它。

阅读则完全相反：

with gzip.GzipFile(jsonfilename, 'r') as fin:    # 4. gzip
    json_bytes = fin.read()                      # 3. bytes (i.e. UTF-8)
json_str = json_bytes.decode('utf-8')            # 2. string (i.e. JSON)
data = json.loads(json_str)                      # 1. data
print(data)

当然，这些步骤可以合并：

with gzip.GzipFile(jsonfilename, 'w') as fout:
    fout.write(json.dumps(data).encode('utf-8'))

和

with gzip.GzipFile(jsonfilename, 'r') as fin:
    data = json.loads(fin.read().decode('utf-8'))

以上是 Python 3，从/向gzip文件读取/写入压缩的json对象的全部内容，来源链接： utcz.com/qa/431645.html

Python 3，从/向gzip文件读取/写入压缩的json对象

回答：

其他人也看了：