前言
由于 Redis 是内存数据库,因此会将自己的数据库状态存储在内存当中,但是,一旦服务器进程出现意外退出了,若不想办法将存储在内存中的数据库状态保存到磁盘中,则服务器中的数据库状态也会消失不见。
为了避免数据的意外丢失,需要将内存中的数据库状态保存到磁盘中。
为此,Redis 提供了持久化技术以达到该目的。
在 Redis 中,持久化拥有以下三种方式:
- RDB(
Redis DataBase
):快照方式,将某一个时刻的内存数据,以二进制的方式写入磁盘; - AOF(
Append Only File
):文件追加方式,记录所有的操作命令,并以文本的形式追加到文件中; - 混合持久化方式:Redis 4.0 之后新增的方式,其结合了 RDB 和 AOF 的优点,在写入的时候,先把当前的数据以 RDB 的形式写入文件的开头,再将后续的操作命令以 AOF 的格式存入文件,既能保证 Redis 重启时的速度,又能减低数据丢失的风险。
RDB
RDB 通过快照形式,可将某个时间点上的数据库状态压缩保存到一个二进制文件中,需要时 Redis 可还原数据库状态为生成此文件时的数据库状态。
由于 RDB 文件是保存在硬盘中的,因此即使 Redis 服务器进程退出,甚至运行 Redis 服务器的计算机停机,但只要 RDB 文件仍然存在,Redis 服务器就可以用它来还原数据库状态。
作用时间点
RDB 文件是如何起作用的呢?
从设计层面而言,要想保证数据安全,应当将数据保存下来,在需要的时候通过保存的文件进行数据恢复工作,因此,我们只需要关注两个核心问题:
- Redis 服务器是在什么时候创建 RDB 文件的
- Redis 服务器又是在什么阶段需要通过 RDB 文件进行数据恢复的
RDB 文件的创建
RDB 文件在何时创建的呢?
在关注何时之前,我们先了解下 Redis 中是如何创建 RDB 文件的。
生成 RDB 文件的方式
在 Redis 中,存在两个命令用于生成 RDB 文件:
SAVE
BGSAVE
SAVE
SAVE
命令可用于生成 RDB 文件,但是它会阻塞服务器进程,直到 RDB 文件创建完毕为止。
因此,在服务器进程阻塞期间,服务器不能处理任何客户端发送的命令请求,只有在服务器执行完SAVE
命令后、重新开始接受命令请求之后,客户端发送的命令才会被处理。
1 | 127.0.0.1:6379> save // 一直等待,直到 RDB 文件创建完毕 |
由于SAVE
的阻塞特性,就出现了不阻塞的BGSAVE
命令。
BGSAVE
与SAVE
命令不同,BGSAVE
命令会 fork(派生)出一个子进程,然后由子进程负责创建 RDB 文件。
在此期间,服务器进程(父进程)将继续处理命令请求,因此 Redis 服务器仍可继续处理客户端的命令请求。1
2127.0.0.1:6379> bgsave // 派生一个子进程,并由子进程创建 RDB 文件
Background saving started
工作原理
BGSAVE
命令的fork
采用的是copy-on-write
技术:
- 当主进程执行读操作时,访问共享内存;
- 当主进程执行写操作时,则会拷贝一份数据,执行写操作
因此,若子进程效率太低,主进程拷贝的数据增多的情况下,会加大内存负担,毕竟数据存了双份嘛。
注意点
BGSAVE
命令不能和BGREWRITEAOF
命令同时执行- 为了防止产生产生竞争条件,
BGSAVE
命令执行期间,客户端发送的SAVE
命令和BGSAVE
命令都会被服务器拒绝
RDB 文件的创建时间
刚刚我们知道了 生成 RDB 文件的命令,但有个问题,我们总不可能一直去服务器手动执行对应命令吧?
确实如此,那应该要搞成自动保存的方式呀!但是自动保存的时间点又是个令人纠结的问题,这可如何是好?
自动间隔性保存
不用纠结,Reds 已经帮我们考虑好了:因为BGSAVE
命令可以在不阻塞服务器进程的情况下执行,所以 Redis 允许用户通过设置服务器配置的save
选项,让服务器每隔一段时间自动执行一次BGSAVE
命令。
用户可以通过save
选项设置多个保存条件,只要其中任意一个条件被满足,服务器就会执行BGSAVE
命令。
以下为redis.conf
文件中相关配置:
1 | # Save the DB on disk: |
既然配置了这些参数,那它们是如何与BGSAVE
命令进行关联的呢?
其实,在 Redis 的服务器中,存在一个默认每隔 100 毫秒执行一次的周期性操作函数serverCron
,该函数用于对正在运行的服务器进行维护,它的一项工作就是检查上面save
选项所设置的保存条件是否已经满足,若满足的话,就执行BGSAVE
命令。
因此,只要满足配置中的 3 个条件中的任意一个保存条件,BGSAVE
命令就会被执行,翻译一下就是:
- 服务器在 900 秒之内,对数据库进行了至少 1 次修改
- 服务器在 300 秒之内,对数据库进行了至少 10 次修改
- 服务器在 60 秒之内,对数据库进行了至少 10000 次修改
当然,以默认方式启动服务器的保存配置并不一样,默认如下:
1 | 127.0.0.1:6379> config get save |
从前面我们知道,RDB 文件是按设置的时间内命令执行达到设置的次数后进行保存的,所以默认配置理解起来就是:
- 服务器在 3600 秒之内,对数据库进行了至少 1 次修改
- 服务器在 300 秒之内,对数据库进行了至少 100 次修改
- 服务器在 60 秒之内,对数据库进行了至少 10000 次修改
RDB 文件的载入
由于 Redis 是内存数据库,当服务器停止,内存中的数据将丢失,为了恢复内存中的数据,在 Redis 运行期间生产了 RDB 文件用于保存数据,因此 Redis 服务器重启时只要重新载入 RDB 文件就可以恢复原先的数据。
自动载入
由于 RDB 文件的载入工作是在服务器启动时自动执行的,所以 Redis 并没有专门用于载入 RDB 文件的命令,只要 Redis 服务器在启动时监测到 RDB 文件存在,它就会自动载入 RDB 文件。
下面为启动服务器时的日志:
1 | 4831:M 08 Apr 2019 10:46:15.806 # Server initialized |
载入的 RDB 文件路径
根据不同的启动方式,载入的 RDB 文件也不相同:
- 默认方式启动时,将载入启动脚本对应目录下的
dump.rdb
文件 - 以指定配置文件方式启动时,服务器载入的是配置文件中指定 RDB 存放路径下
dump.rdb
文件
在生产环境中,一般会专门配置一个数据目录,专门存储 Redis 的数据文件。
在配置文件中,dir
属性用于配置 RDB 文件的存储路径:1
2# 默认生成在启动脚本的目录下
dir ./
注意点
Redis 服务器在载入 RDB 文件期间,会一直处于阻塞状态,直到载入工作完成为止。
文件格式
打开dump.rdb
文件,将显示以下内容:1
2REDIS0009� redis-ver�5.0.4�
redis-bits�@��ctime¾�\��used-mem����aof-preamble���i����=y
显而易见,这是一堆有部分是看不懂的二进制字符,因为 RDB 文件本身就是是一个经过压缩的二进制文件。
默认情况下,RDB 文件就具有一定字节,保存了 Redis 版本等信息。1
2
3
4
5
6
7
8od dump.rdb
0000000 042522 044504 030123 030060 175071 071011 062145 071551
0000020 073055 071145 032405 030056 032056 005372 062562 064544
0000040 026563 064542 071564 040300 002772 072143 066551 141145
0000060 164447 056252 004372 071565 062145 066455 066545 110302
0000100 010007 175000 060414 063157 070055 062562 066541 066142
0000120 140145 177400 014442 141640 160140 073510
0000134
特殊操作对 RDB 文件的影响
停机时
Redis 服务器手动关闭的时候,会自动触发一次 RDB 持久化功能(使用save
命令)。
flushall 对 RDB 文件的影响
当 Redis 执行了flushall
命令之后,也触发自动持久化,其会把 RDB 文件清空。
主从复制对 RDB 文件的影响
在后面要讲的 Redis 主从复制中,当从节点执行全量复制操作时,主节点也会执行bgsave
命令,并将 RDB 文件发送给从节点,该过程也自动触发了 RDB 持久化功能。
AOF
由于 RDB 持久化有一定的时间间隔,因此若在这个时间段内 Redis 服务意外终止了,将造成最新的数据全部丢失。
为此,Redis 还提供了 AOF 方式支持持久化。
与 RDB 通过快照方式记录数据库状态不同,AOF 是通过追加保存 Redis 服务器所执行的写命令来记录数据库状态的,若想还原服务器关闭之前的数据库状态,服务器只要读入并重新执行一遍 AOF 文件里面保存的写命令即可。
前置条件:开启 AOF
与默认开启的 RDB 持久化功能不同,在 Redis 服务器中,默认是关闭 AOF 持久化功能的。
要想开启 AOF 持久化,存在以下两种方式:
- 执行命令:
config set appendonly yes
- 修改
redis.conf
配置文件:将默认的appendonly no
改为appendonly yes
作用时间点
AOF 文件是如何起作用的呢?
从设计层面而言,要想保证数据安全,应当将数据保存下来,在需要的时候通过保存的文件进行数据恢复工作,因此,我们只需要关注两个核心问题:
- Redis 服务器是在什么时候创建 AOF 文件的
- Redis 服务器又是在什么阶段需要通过 AOF 文件进行数据恢复的
AOF 文件的创建
若想创建一个 AOF 文件,需要将数据保存到 AOF 文件中,那么这个过程是怎样的呢?
具体而言,此过程可分为以下三个步骤.:
- 命令追加(append)
- 文件写入
- 文件同步(sync)
命令追加
当 AOF 持久化功能处于打开状态时,服务器在执行完一个写命令之后,会以协议格式将被执行的写命令追加到服务器状态的aof_buf
缓冲区的末尾。
文件写入
Redis 的服务器进程就是一个事件循环(loop),这个循环中的文件事件负责接受客户端的命令请求,以及向客户端发送命令回复,而时间事件则负责执行像serveerCron
函数这样需要定期运行的函数。
为了提高文件的写入效率,在现代操作系统中,当用户调用write
函数,将一些数据写入到文件的时候,操作系统通常会将写入数据暂时保存在一个内存缓冲区中,等到缓冲区的空间被填满,或者超过了指定的时限之后,才真正地将缓冲区中的数据写入到磁盘里面
因为服务器在处理文件事件时可能会执行写命令,使得一些内容被追加到aof_buf
缓冲区里面,所以在服务器每次结束一个事件循环之前,它都会调用flushAppendOnlyFile
函数,考虑是否需要将aof_buf
缓冲区的内容写入和保存到 AOF 文件里面,它的行为由redis.conf
设置的appendfsync
属性来决定,配置如下。
1 | # The fsync() call tells the Operating System to actually write data on disk |
其中的appendfsync
属性, 代表 AOF 文件的保存模式,取值存在 3 个:
always
:服务器在每个事件循环后都要将写入进aof_buf
缓冲区中的所有数据同步到 AOF 文件。虽然其效率是 3 个值中最慢的一个,但从安全行来说,它是最安全的,因为即使出现故障停机,AOF 持久化也只会丢失一个事件循环中所产生的命令数据。everysec
:默认模式,服务器每隔一秒将写入进aof_buf
缓冲区中的所有数据同步到 AOF 文件。从效率上来说,该模式足够快,并且就算出现故障停机,数据库也只丢失一秒钟的命令数据。no
:服务器在每个事件循环后将所有数据写入aof_buf
缓冲区中,至于何时同步 AOF 文件,则由操作系统控制。因为该模式无需隔时间同步操作,所以写入速度是最快的。不过因为会在系统缓存中积累一段时间的写入数据,所以该模式的单次同步时长是最长的。若服务机出现故障时,将丢失上次同步之后的所有写命令数据。
注
:写入 = 数据进内存缓冲区, 同步 = 缓冲区数据进硬盘
文件同步(待研究)
虽然写入时的缓冲区机制提高了效率,但也带来了安全问题。若计算机停机,那么保存在内存缓冲区里面的写入数据将会丢失。
为此,系统提供了fsync
和fdatasync
两个同步函数,它们可以强制让操作系统立即将缓冲区中的数据写入到硬盘里面,从而确保写入数据的安全性。
AOF 文件的载入
由于 Redis 是内存数据库,当服务器停止,内存中的数据将丢失,为了恢复内存中的数据,在 Redis 运行期间会追加数据到 AOF 文件用于保存数据,因此 Redis 服务器重启时只要重新载入 AOF 文件就可以恢复原先的数据。
文件格式
1 | 127.0.0.1:6379> set age 18 |
当执行完上面命令后,会生成一个appendonly.aof
文件,该文件的所有命令都是以 Redis 的命令请求协议格式保存的,其内容如下:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22*2
$6
SELECT
$1
0
*3
$3
set
$3
age
$2
18
*2
$4
incr
$3
age
*2
$4
incr
$3
age
该文件中,除了用于指定数据库的SELECT
命令是服务器自动添加的,其他命令都是之前执行的命令。
服务器启动时,会载入 AOF 文件并执行其中保存的命令来还原服务器关闭之前的数据库状态。
文件重写机制
由于 AOF 持久化是通过保存被执行的写命令来记录数据库状态的,所以随着服务器运行时间的流逝,AOF 文件中的内容会越来越多,文件的体积也越来越大。若不加以控制,可能对 Redis 服务器、甚至整个宿主机造成影响,另外,随着文件体积增大,进行数据还原的所需的时间也会变长。
为此,Redis 提供了 AOF 文件重写(rewrite
)功能,类似于压缩。通过该功能,Redis 服务器可以创建一个新的 AOF 文件来替代现有的 AOF 文件,新旧两个文件保存的数据库状态相同,但新的体积更小。
我们前面的例子已经创建了一个 AOF 文件,当再执行重写命令bgrewriteaof
后:
1 | 127.0.0.1:6379> bgrewriteaof |
appendonly.aof
变为如下格式:
1 | REDIS0009� redis-ver5.0.4� |
我们使用的是后台重写,原因和 RDB 文件保存和后台保存类似,不仅可以防止线程被长时间阻塞,还可以避免使用锁来保证数据的安全性。
可是在重写期间,若服务器进程还继续处理命令请求,新命令可能对现有数据库进行更改,会使得服务器当前状态和重写后的状态不一致,这又怎么办呢?
为了解决数据不一致问题,Redis 服务器设置了一个 AOF 重写缓冲区,在服务器创建子进程之后使用,当 Redis 服务器执行完一个写命令后,会同时将这个写命令发送给 AOF 缓冲区和 AOF 重写缓冲区,保证数据的一致性,如下图:
安全性疑问
问
:既然 AOF 文件是纯文本格式,有一定格式,那能否在其上增加或删除一些命令来篡改原文件呢?答
:并不能,Redis 存在了一定的检验机制,当发现该文件出现了错误文本时,会提示文件错误,请求错误修复。因此若你按其指定格式来增加命令,该命令会被识别为错误命令,不会执行该命令且报错。
RDB VS AOF
因为 AOF 文件的更新频率通常比 RDB 文件的更新频率高,所以在 Redis 启动加载数据文件时:
- 若只开启了 AOF 持久化,Redis 启动时只会加载 AOF 文件进行数据恢复;
- 若只开启了 RDB 持久化,Redis 启动时只会加载 RDB 文件进行数据恢复
- 若同时开启了 RDB 和 AOF 持久化,Redis 启动时只会加载 AOF 文件进行数据恢复,此情况下即使 AOF 文件不存在,只有 RDB 文件,也不会加载 RDB 文件
指标\种类 | RDB | AOF |
---|---|---|
持久化方式 | 定时对整个内存做快照 | 记录每一次执行的命令 |
数据完整性 | 不完整,两次备份之间会丢失 | 相对完整,取决于刷盘策略 |
文件大小 | 会有压缩,文件体积小 | 记录命令,文件体积很大 |
宕机恢复速度 | 很快 | 慢 |
数据恢复优先级 | 低,因为数据完整性不如 AOF | 高,因为数据完整性更高 |
系统资源占用 | 高,大量CPU和内存消耗 | 低,主要是磁盘 IO 资源,但 AOF 重写时会占用大量 CPU 和内存资源 |
使用场景 | 追求更快的启动速度,可以容忍数分钟的数据丢失 | 对数据安全性要求较高 |
RDB 优点
- 节省磁盘空间
- 恢复速度快
RDB 缺点
- 虽然 Redis 在 fork 时使用了写时拷贝技术,但若数据庞大时会比较消耗性能
- 由于一定时间间隔做一次备份,若服务器意外宕机,就会丢失最后一次快照后的所有修改
AOF 优点
- 备份机制更稳定,丢失数据概率更低
- 可读性强的日志文本,可以处理误操作
AOF 缺点
- 耗费更多磁盘空间:对于相同的数据集来说,AOF 文件要比 RDB 文件更大
- 每次读写都进行同步操作,对服务器有一定性能的压力
混合持久化
RDB 和 AOF 持久化各有利弊:
- RDB 可能会导致一定时间内的数据丢失
- AOF 由于文件较大则会影响 Redis 的启动速度
为了能同时使用 RDB 和 AOF 各种的优点,Redis 4.0 之后新增了混合持久化的方式。
在开启混合持久化的情况下,AOF 重写时会把 Redis 的持久化数据,以 RDB 文件的格式写入到 AOF 文件的开头,之后的数据再以 AOF 的格式化追加的文件的末尾。
因此,此时重写的 AOF 文件由两种格式的数据([RDB file][AOF tail]
)组成。
开启混合持久化
在稳定的 Redis 6.2.6 版本中,若开启了 AOF 持久化功能,混合持久化功能也自动开启了,配置文件中对应的属性值如下:1
2# 是否开启混合持久化
aof-use-rdb-preamble yes
数据恢复
混合持久化的数据恢复和 AOF 持久化过程是一样的,只需要把appendonly.aof
文件存放放到 Redis 的根目录,在服务启动时,只要开启了 AOF 持久化,Redis 就会自动加载并恢复数据。
工作流程
混合持久化的加载流程如下:
- ① 判断是否开启 AOF 持久化,开启继续执行后续流程,未开启执行加载 RDB 文件的流程;
- ② 判断
appendonly.aof
文件是否存在,文件存在则执行后续流程; - ③ 判断 AOF 文件开头是否位 RDB 的格式,
- 若是,先加载 RDB 内容再加载剩余的 AOF 内容
- 若不是,直接以 AOF 格式加载整个文件
最佳实践
虽然持久化功能保证了数据不丢失,但同时也拖慢了 Redis 的运行速度,那么,如何更合理的使用 Redis 的持久化功能呢?
笔者收集了以下几种方案:
- 不开启持久化
- 启用混合持久化
- 集群部分启用持久化
不开启持久化
根据实际的业务情况考虑,若业务对数据的丢失不敏感的情况下,可考虑关闭 Redis 的持久化,让 Redis 完全基于内存运行,效率最高。
启用混合持久化
若一定要使用持久化功能,最好使用混合持久化功能,其结合了 RDB 和 AOF 的优点。
集群部分启用持久化
集群模式部署时,可以部分开启持久化功能,区分主机从机,一台用于响应主业务,一台用于数据持久化,这样可让 Redis 更加高效的运行。
具体策略:
master
:不开启,让 master 达到最佳性能slave
:开启 AOF 混合持久化(若对数据安全要求不高,可开启 RDB 关闭 AOF)
参考
- Redis 官方文档
- 黄健宏 Redis 设计与实现 [M]. 机械工业出版社,2014
文章信息
时间 | 说明 |
---|---|
2019-04-13 | 初稿 |
2022-10-26 | 部分重构 |