redis系列之简单的动态字符串(SDS)
前言
Redis 没有直接使用 C 语言传统的字符串表示(以空字符结尾的字符数组,以下简称 C 字符串), 而是自己构建了一种名为简单动态字符串(simple dynamic string,SDS)的抽象类型, 并将 SDS 用作 Redis 的默认字符串表示。
个人感觉SDS类似于Java的ArrayList,大家可以拿两者对比一些,谁的效率更加高一点。
SDS定义
1struct sdshdr { 2 3// 记录 buf 数组中已使用字节的数量
4// 等于 SDS 所保存字符串的长度
5int len;
6
7// 记录 buf 数组中未使用字节的数量
8intfree;
9
10// 字节数组,用于保存字符串
11char buf[];
12
13 };
这里注意一下。C语言的char是占一个字节的。不像Java的char占两个字节。也就是只有八位,-127 - 128。
SDS相比于C字符串的优势
1. 常数复杂度获取字符串长度
- 这个比较好理解,因为SDS里面有一个字段为len,可以直接获取长度
2. 减少修改字符串时带来的内存重分配次数
- 因为传统的c字符串,不会自动扩容。而且其内存大小就等于字符串长度+1,因此,每修改一次字符串,都要重新分配一次内存,非常的耗费时间
- SDS会自动扩容,并且会进行空间预分配。比如现在有一个Hello的字符串。内存的大小可能是Hello的两倍,也就是 5 * 2 = 10。当再次扩容字符串的时候,不一定需要再次分配内存了。并且可以自动扩容,假设10不够了,加了一个字符串后大小为13,那么内存就会分配为 13 * 2 = 26大小的内存。
3. 二进制安全,以及可以保存空字符
- C 字符串中的字符必须符合某种编码(比如 ASCII), 并且除了字符串的末尾之外, 字符串里面不能包含空字符, 否则最先被程序读入的空字符将被误认为是字符串结尾 —— 这些限制使得 C 字符串只能保存文本数据, 而不能保存像图片、音频、视频、压缩文件这样的二进制数据。
- 因此,所有 SDS API 都会以处理二进制的方式来处理 SDS 存放在
buf
数组里的数据 - 也就是保存在buf数组里面的所有东西,不论英文中文,还是图片音频,都是二进制数据流。
原文出处:https://www.cnblogs.com/wenbochang/p/11666734.html
以上是 redis系列之简单的动态字符串(SDS) 的全部内容, 来源链接: utcz.com/z/508759.html