一、Redis 对象
1.1 Redis 对象简介
Redis 使用对象来表示数据库中键和值,当我们在数据库中存储一个键值对时,至少会创建两个对象,一个对象用于存储键值对的键,另一个对象用于存储键值对的值。
Redis 中的每一个对象都由一个 RedisObject
结构表示,该结构有三个属性和保存的数据有关,分别是 type 属性、encoding
属性和 ptr
属性。
typedef struct redisObject {
// 类型
unsigned tepe:4;
// 编码
unsigned encoding:4;
// 指向底层数据实现数据结构的指针
void *ptr;
} robj;
1.2 对象类型
redisObject
对象的 type
属性记录了对象的类型,Redis 中的键总是一个字符串对象,值对象可以是字符串对象、哈希对象、集合对象等。
我们可以通过使用 TYPE key
命令查看数据库键对应的值对象的类型。
1.3 编码与底层实现
encoding
属性记录了对象所使用的编码,也就是这个对象底层实现的数据结构。关于编码可以使用 OBJECT ENCODING key
命令查看。
二、五种数据类型对象与编码
2.1 字符串对象
要注意的是 long
、double
浮点数在 Redis 中也是作为字符串值来保存的。
(1)字符串对象编码
字符串对象的编码有 int
、 raw
或者 embstr
三种。
-
int
:保存的是整数值 -
raw
:保存的是字符串,并且字符串的长度小于等于 39 个字节 -
embstr
:保存的是字符串,并且字符串的长度大于等于 39 个字节
embstr
编码的好处:
-
embstr
编码将创建字符串对象所需的内存分配次数从raw
编码的两次降低为一次。 - 释放
embstr
编码的字符串对象只需要调用一次内存释放函数, 而释放raw
编码的字符串对象需要调用两次内存释放函数。 - 因为
embstr
编码的字符串对象的所有数据都保存在一块连续的内存里面,所以这种编码的字符串对象比起raw
编码的字符串对象能够更好地利用缓存带来的优势。
(2)编码转换
int
编码的字符串对象和 embstr
编码的字符串对象在一定条件下, 会被转换为 raw
编码的字符串对象,如下。
-
int
编码的字符串对象通过某些操作,保存的不再是单纯的整数值 - 对
embstr
编码的字符串对象执行任何修改命令时, 程序会先将对象的编码从embstr
转换成raw
, 然后再执行修改命令
下面是一个例子,供参考:
127.0.0.1:6379> SET num-str 100
OK
127.0.0.1:6379> OBJECT ENCODING num-str
"int"
127.0.0.1:6379> APPEND num-str "hei~"
(integer) 7
127.0.0.1:6379> OBJECT ENCODING num-str
"raw"
2.2 列表对象
(1)列表对象编码
Redis 3.2 以前的版本中列表的的编码类型有 ziplist
或 linkedlist
。
ziplist
编码的列表对象使用压缩列表作为底层实现, 每个压缩列表节点(entry)保存了一个列表元素。
linkedlist
编码的列表对象使用双端链表作为底层实现, 每个双端链表节点(node)都保存了一个字符串对象, 而每个字符串对象都保存了一个列表元素。
在 Redis 3.2 以上的版本中列表对象的编码替换为 quicklist
,它的底层实现是一个双向链表,而且是一个ziplist
数据结构的双向链表。关于这种数据结构的详细信息就不介绍了,以后有机会接触到 Redis 的源码后再单独拿出来总结。
例子如下(基于 3.2.× 版本):
127.0.0.1:6379> RPUSH students "zs" "ls" "ww"
(integer) 3
127.0.0.1:6379> OBJECT ENCODING students
"quicklist"
2.3 哈希对象
(1)哈希对象编码
哈希对象的编码是 ziplist
或 hashtable
。
ziplist
编码的哈希对象使用压缩列表作为底层实现,每当有新的键值对要加入到哈希对象时,程序会先将保存了键的压缩列表节点推入到压缩列表表尾,然后再将保存了值的压缩列表节点推入到压缩列表表尾。因此保存了同一键值对的两个节点总是紧挨在一起, 保存键的节点在前, 保存值的节点在后。
hashtable
编码的哈希对象使用字典作为底层实现,哈希对象中的每个键值对都使用一个字典键值对来保存。
(2)编码转换
当哈希对象可以同时满足以下两个条件时, 哈希对象使用 ziplist
编码。
- 键和值的字符串长度都小于 64 字节
- 键值对数量小于 512 个
不能满足上面两个条件的哈希对象使用 hashtable
编码。
PS:
上面两个条件的上限值是可以在配置文件中修改的,默认配置如下:
hash-max-ziplist-entries 512
hash-max-ziplist-value 64
下面是一个例子:
127.0.0.1:6379> OBJECT ENCODING student
"ziplist"
# 存储一个大于 64 字节的值
127.0.0.1:6379> HSET student desc "zzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzz ... "
(integer) 1
127.0.0.1:6379> OBJECT ENCODING student
"hashtable"
2.4 集合对象
(1)集合对象编码
集合对象的编码可以是 intset
或者 hashtable
。
inset
编码的底层实现是整数集合,集合对象包含的所有元素都被保存在整数集合里。
hashtable
编码使用字典作为底层实现,字典的每个键都是一个字符串对象,每个字符串对象包含了一个集合元素,而字典的值则全部被设置为 NULL
,可以类比于 Java 中的 HashSet
的实现。
(2)编码转换
当集合对象可以满足以下两个条件中的任一个时, 对象使用 intset
编码:
- 集合对象中的元素都是整数值
- 集合对象中元素的数量不超过 512 个
PS:
上面第二个条件的上限值是可以在配置文件中修改的,默认配置如下:
set-max-intset-entries 512
下面是一个例子:
127.0.0.1:6379> SADD keys "1" "2"
(integer) 2
127.0.0.1:6379> OBJECT ENCODING keys
"intset"
# 添加非整数元素
127.0.0.1:6379> SADD keys "hei~"
(integer) 1
127.0.0.1:6379> OBJECT ENCODING keys
"hashtable"
2.5有序集合对象
(1)有序集合对象编码
有序集合的编码可以是 ziplist
或者 skiplist
。
压缩列表内的集合元素按分值从小到大进行排序,分值较小的元素被放置在靠近表头的方向, 分值较大的元素则被放置在靠近表尾的方向。
skiplist
编码的有序集合对象使用 zset
结构作为底层实现, 一个 zset
结构同时包含一个字典和一个跳跃表。
为什么 zset
结构要同时使用字典与跳跃表来实现有序集合?
- 如果只使用字典实现有序集合,查找成员的复杂度为O(1),但是当执行范围操作时,就需要对字典中保存的元素进行排序。
- 如果只使用跳跃表实现有序集合,执行范围操作时的所有优点都会被保留,但是执行查找元素时,时间复杂度上升为O(logN)
- 因此
zset
集成了字典与跳跃表两者的优点来实现有序集合对象。
(2)有序集合对象编码转换
当有序集合对象满足以下条件时,对象会使用 ziplist
编码:
- 有序集合保存的元素数量小雨 128 个
- 有序集合保存的所有元素成员长度小于 64 字节
PS:
上面第二个条件的上限值是可以在配置文件中修改的,默认配置如下:
zset-max-ziplist-entries 128
zset-max-ziplist-value 64
参考书籍
《Redis 设计与实现》黄健宏著