Python 3,从/向gzip文件读取/写入压缩的json对象

对于Python3,我遵循@MartijnPieters的代码:

import gzip

import json

# writing

with gzip.GzipFile(jsonfilename, 'w') as fout:

for i in range(N):

uid = "whatever%i" % i

dv = [1, 2, 3]

data = json.dumps({

'what': uid,

'where': dv})

fout.write(data + '\n')

但这会导致错误:

Traceback (most recent call last):

...

File "C:\Users\Think\my_json.py", line 118, in write_json

fout.write(data + '\n')

File "C:\Users\Think\Anaconda3\lib\gzip.py", line 258, in write

data = memoryview(data)

TypeError: memoryview: a bytes-like object is required, not 'str'

有什么想法吗?

回答:

这里有四个转换步骤。

  1. Python数据结构(嵌套字典,列表,字符串,数字,布尔值)
  2. 包含该数据结构(“ JSON”)的序列化表示形式的Python字符串
  3. 包含该字符串表示形式的字节列表(“ UTF-8”)
  4. 包含先前字节列表(“ gzip”)表示形式的字节列表

因此,让我们一步一步地采取这些步骤。

import gzip

import json

data = []

for i in range(N):

uid = "whatever%i" % i

dv = [1, 2, 3]

data.append({

'what': uid,

'where': dv

}) # 1. data

json_str = json.dumps(data) + "\n" # 2. string (i.e. JSON)

json_bytes = json_str.encode('utf-8') # 3. bytes (i.e. UTF-8)

with gzip.GzipFile(jsonfilename, 'w') as fout: # 4. gzip

fout.write(json_bytes)

注意,"\n"这里添加完全是多余的。它不会破坏任何东西,但是除此之外,它没有任何用处。我添加它只是因为您的代码示例中包含了它。

阅读则完全相反:

with gzip.GzipFile(jsonfilename, 'r') as fin:    # 4. gzip

json_bytes = fin.read() # 3. bytes (i.e. UTF-8)

json_str = json_bytes.decode('utf-8') # 2. string (i.e. JSON)

data = json.loads(json_str) # 1. data

print(data)

当然,这些步骤可以合并:

with gzip.GzipFile(jsonfilename, 'w') as fout:

fout.write(json.dumps(data).encode('utf-8'))

with gzip.GzipFile(jsonfilename, 'r') as fin:

data = json.loads(fin.read().decode('utf-8'))

以上是 Python 3,从/向gzip文件读取/写入压缩的json对象 的全部内容, 来源链接: utcz.com/qa/431645.html

回到顶部