序列化模块（json、pickle）

Z时代
2024-01-10
分类：综合

python

序列化模块

1、什么是序列化、反序列化？

　　序列：指的就是字符串（*****）

　　序列化：将python或者其他语言的数据类型转换成字符串类型。

　　　　python默认数据类型：int、float、str、list、tuple、dict、bool、set

　　过程：

　　　　序列化：其他数据类型 ---> 字符串 ---> 文件中

　　　　反序列化：文件中 ---> 字符串 ---> 其他数据类型

2、json模块

　　json是一个序列化模块，是一个“第三方”的特殊数据格式

　　使用json保存数据：

　　　　可以将python数据类型 ---> json数据格式 ---> 字符串 ---> 文件中，

　　其他语言使用pathon数据：

　　　　文件中 ---> 字符串 ---> json数据格式 ---> 其他语言的数据类型

　　为什么要使用json模块

　　为了让不同的语言之间数据可以共享

　　由于各种语言的数据类型不一，但数据一样，比如python不能直接使用其他语言的数据类型，必须将其他语言的数据类型转换成json数据格式，python获取到json数据之后可以将json转换成python的数据类型拿来使用

　　注意：在json中所有的字符串都是双引号

　　哪些数据类型可以被序列化？

　　列表、元组、字典都可以，集合set不可以

　　json.dumps()：

　　　　- json.dumps(), f = open(), f.write

　　　　# 序列化：.dumps()将python数据 ---> json数据格式 ---> 字符串

　　json.loads()：

　　　　- f = open(), str = f.read(), json.loads(str)

　　　　# 反序列化：.loads()字符串 ---> json数据格式 ---> python或者其他语言的数据类型

　　注意：上面两种方法不会内部不能读、写文件，需要手动写代码

　　例1：使用json模块存、取列表

# 存列表
import json
list1 = ["bear", "apple", "orange", "李二狗"]
# .dumps()将python数据  --->  json数据格式  --->  字符串
json_list1 = json.dumps(list1, ensure_ascii=False)    # ensure_ascii将默认的ascii取消设置为False，可以在控制台看到中文，否则中文显示为bytes类型数据
print(json_list1)
print(type(json_list1))    # 字符串类型
# .loads()字符串 ---> json数据格式 --->  python数据
list2 = json.loads(json_list1)
print(list2)
print(type(list2))    # 列表类型

　　执行结果：

["bear", "apple", "orange", "李二狗"]
<class"str">
["bear", "apple", "orange", "李二狗"]
<class"list">

　　例2：使用json模块存、取元组

# 存元组
import json
tuple1 = ("bear", "apple", "orange", "李二狗")
json_tuple1 = json.dumps(tuple1, ensure_ascii=False)    # ensure_ascii将默认的ascii取消设置为False，可以在控制台看到中文，否则中文显示为bytes类型数据
print(json_tuple1)
print(type(json_tuple1))    # 字符串类型
tuple2 = json.loads(json_tuple1)
print(tuple2)
print(type(tuple2))    # 列表类型

　　执行结果：

["bear", "apple", "orange", "李二狗"]
<class"str">
["bear", "apple", "orange", "李二狗"]
<class"list">

　　例3：使用json模块存、取字典

# 存字典
import json
dic1 = {
"name": "坦克",
"age": 18
}
json_dic1 = json.dumps(dic1, ensure_ascii=False)
print(json_dic1)
print(type(json_dic1))    # 字符串类型
dic2 = json.loads(json_dic1)
print(dic2)
print(type(dic2))    # 字典类型

　　执行结果：

{"name": "坦克", "age": 18}
<class"str">
{"name": "坦克", "age": 18}
<class"dict">

　　案例：写一个注册功能，将用户名密码存放在字典，然后使用json序列化字典存在本地文件中

# 注册功能
import json
def register():
    username = input("请输入用户名>>>: ").strip()
    password = input("请输入密码>>>: ").strip()
    re_password = input("请再次输入密码>>>: ").strip()
if re_password == password:
        user_dict = {
"name" : username,
"pwd" : password
        }
# 将字典序列化
        json_dict = json.dumps(user_dict, ensure_ascii=False)
# 开始写入文件中
# 注意：保存json数据时，用.json作为文件的后缀名，让人见名知意
        with open("user.json", "w", encoding="utf-8") as f:
            f.write(json_dict)

　　json.dump()： # 序列化：.dumps()将python数据 ---> json数据格式 ---> 字符串

　　　　- 内部实现f.write

　　json.load()： # 反序列化：.loads()字符串 ---> json数据格式 ---> python或者其他语言的数据类型

　　　　- 内部实现f.read()

　　注意：上面两种方法可以内部读、写文件，无需再写读、写的代码（推荐使用）

　　例：将字典存放到本地json文件内

# dump，load演示
import json
dic2 = {
"username": "坦克",
"age": 17
}
# 写入数据
with open("user.json", "w", encoding="utf-8") as f1:
    json.dump(dic2, f1, ensure_ascii=False)
# 读数据
with open("user.json", "r", encoding="utf-8") as f2:
    dic3 = json.load(f2)
print(dic3)

　　执行结果：

{"username": "坦克", "age": 17}

3、pickle模块

　　pickle是一个python自带的序列化模块，

　　pickle模块可以存集合，但是里面只能含有字符串类型数据

　　注意：pickle模块存取数据必须以bytes存入

　　优点：

　　　　可以支持python中所有的数据类型

　　　　可以直接存bytes类型的数据

　　　　存取速度要比json快

　　缺点（致命的缺点）：

　　　　只能支持python使用，不能跨平台

　　例：将集合set1写入以.pickle结尾的文件

import pickle
set1 = {"1", "name", "坦克"}# 文件以.pickle命名，二进制写入文件
with open("user.pickle", "wb") as f1:
    pickle.dump(set1, f1)
# 以二进制读取文件
with open("user.pickle", "rb") as f2:
    set2 = pickle.load(f2)
print(set2)