Redis学习(四)之持久化、缓存雪崩穿透

一、Redis.conf详解

启动的时候,通过配置文件来启动

单位

配置文件unit单位对大小写不敏感

1635677546030

包含

就好比我们学习Spring的Import和include

1635677743309

网络

1
2
3
bind 0.0.0.0 -::1 # 绑定的ip,设置为0.0.0.0 即没有绑定IP
protected-mode no # 保护模式
port 6378 # 端口设置

通用 GENERAL

1
2
3
4
5
6
7
8
9
10
11
12
13
daemonize yes # 以守护进程的方式运行,默认是no,我们需要自己开启为yes!
pidfile /var/run/redis_6379.pid # 如果以后台的方式运行,我们就需要指定一个pid文件
# 日志
# Specify the server verbosity level.
# This can be one of:
# debug (a lot of information, useful for development/testing)
# verbose (many rarely useful info, but not a mess like the debug level)
# notice (moderately verbose, what you want in production probably)
# warning (only very important / critical messages are logged)
loglevel notice
logfile "" # 日志的文件配置名
databases 16 # 数据库的数量,默认是16个数据库
always-show-logo no # 是否总是显示LOGO

快照

持久化,在规定的时间内,执行了多少次操作,则会持久化到文件.rdb.aof

Redis是内存数据库,如果没有持久化,那么数据断电即失

1
2
3
4
5
6
7
8
9
10
# 如果3600秒内,如果至少有1个key进行了修改,我们及时进行持久化操作
# save 3600 1
# 如果300秒内,如果至少有100个key进行了修改,我们及时进行持久化操作
# save 300 100
# 如果600秒内,如果至少有10000个key进行了修改,我们及时进行持久化操作
# save 60 10000
stop-writes-on-bgsave-error no # 持久化如果出错,是否还需要继续工作!
rdbcompression yes # 是否压缩rdb文件,需要消耗一些cpu资源!
rdbchecksum yes # 在保存rdb文件的时候,进行错误的检查校验!
dir ./ # rdb文件保存的目录!

REPLICATION 复制

SECURITY安全

可以设置redis的密码,默认是没有密码的!

1
2
3
4
5
6
7
8
9
10
11
12
13
127.0.0.1:6378> ping
PONG
127.0.0.1:6378> config get requirepass # 获取redis的密码
1) "requirepass"
2) ""
127.0.0.1:6378> config set requirepass "123456" # 设置redis的密码
OK
127.0.0.1:6378> ping # 退出后,重新在登录,则提示没有权限,如下图
(error) NOAUTH Authentication required.
127.0.0.1:6378> auth 123456 # 使用密码进行登录
OK
127.0.0.1:6378> ping
PONG

1635678891788

限制 CLIENTS

1
2
3
4
5
6
7
8
9
maxclients 10000 # 设置能连接上redis的最大客户端的数量
maxmemory <bytes> # redis配置最大的内存容量
maxmemory-policy noeviction # 内存达到上限之后的处理策略
# 1、volatile-lru:只对设置了过期时间的key进行LRU(默认值)
# 2、allkeys-lru : 删除lru算法的key
# 3、volatile-random:随机删除即将过期key
# 4、allkeys-random:随机删除
# 5、volatile-ttl : 删除即将过期的
# 6、noeviction : 永不过期,返回错误

APPEND ONLY MODE 模式,aof配置

1
2
3
4
5
appendonly no # 默认是不开启aof模式的,默认是使用rdb方式持久化,在大部分所有的情况下,rdb完全够用!
appendfilename "appendonly.aof" # 持久化的文件的名字
# appendfsync always # 每次修改都会sync,消耗性能
appendfsync everysec # 每秒执行一次sync,可能会丢失这1秒的数据
# appendfsync no # 不执行sync,这个时候操作系统自己同步数据,速度最快!

二、Redis持久化

Redis是内存数据库,如果不将内存中的数据库状态保存到磁盘,那么一旦服务器进程退出,服务器中的数据库状态也会消失。所以Redis提供了持久化功能!

RDB(Redis DataBase)

什么是RDB

在主从复制中,rdb就是备用在从机上面!

1635680113243

在指定的时间间隔内,将内存中的数据集快照写入磁盘,也就是Snapshot快照,它恢复时将快照文件直接读到内存中。

Redis会单独创建(fork)一个子进程来持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,子进程是不进行任何IO操作的。这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。我们默认的就是RDB,一般情况下不需要修改这个配置!

rdb保存的文件是dump.rdb

1635680402783

1635680543424

触发机制

1、save的规则满足的情况下,会触发rdb规则!

​ 如:上面设置ide60s内修改了5次key,则会生成rdb文件

2、执行flushall命令,也会触发我们的rdb规则!

​ 如:先将目录下的rdb文件删除,执行flushall命令,会生成rdb文件

3、退出redis,也会产生rdb文件!

备份就自动生成一个dump.rdb!

1635681076654

如何恢复rdb文件!

1、只需要将rdb文件放在我们redis启动目录就可以,redis启动的时候会自动检查dump.rdb并恢复其中的数据!

2、查看需要存在的位置

1
2
3
127.0.0.1:6378> config get dir
1) "dir"
2) "/usr/local/bin" # 如果在这个目录下存在dump.rdb文件,启动就会自动恢复其中的数据

优点:

1、适合大规模的数据恢复!

2、对数据的完整性要求不高!

缺点:

1、需要一定的时间间隔进行操作!如果redis意外宕机,这个最后一次修改的数据就没有!

2、fork进程的时候,会占用一定的内存空间!

AOF(Append Only File)

将我们的所有命令都记录下来,恢复的时候就把这个文件全部在执行一遍!

是什么

1635682366117

以日志的形式来记录每个写操作,将Redis执行过的所有指令记录下来(读操作不记录),只允许追加文件但不可以改写文件,redis启动之初会读取该文件重新构建数据,换言之,redis重启的话,就会根据日志文件的内容将写指令从前到后执行一次,以完成数据的恢复工作!

AOF保存的是appendonly.aof文件

1635682548853

默认是不开启的,需要手动进行配置!只需将appendonly 修改为yes。

重启,Redis即可生效!

1635682987755

重新连接redis则会报错

1635683050281

如果这个aof文件有错位,这时候redis是启动不成功,我们需要修复这个aof文件,使用如下命令进行修复

1
redis-check-aof --fix appendonly.aof  # 修复aof文件中的错位
1
2
3
4
5
6
[root@VM-4-7-centos bin]# redis-check-aof --fix appendonly.aof 
0x a8: Expected prefix '*', got: 's'
AOF analyzed: size=190, ok_up_to=168, ok_up_to_line=41, diff=22
This will shrink the AOF from 190 bytes, with 22 bytes, to 168 bytes
Continue? [y/N]: y
Successfully truncated AOF

重启Redis即可成功!

重写规则说明

aof默认的就是文件的无限追加,文件会越来越大!

1635683444676

如果aof文件大于64M,太大了,父进程会fork一个新的进程来将我们的文件进行重写!

优缺点

优点:

1、每一次修改都同步,文件的完整性会更加好!

2、每秒同步一次,可能会丢失一秒的数据

3、从不同步,效率最高!

缺点:

1、相对于数据文件来说,aof远远大于rdb,修复的速度也比rdb慢!

2、aof运行效率也比rdb慢,所以我们Redis默认的配置就是rdb持久化,而不是aof

扩展

1、RDB持久化方式能够在指定的时间间隔内对数据进行快照存储!

2、AOF持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF命令以Redis协议追加保存每次写的操作到文件末尾,Redis还能对AOF文件进行后台重写,使得AOF文件的体积不至于过大!

3、只做缓存,如果你只希望你的数据在服务器运行的时候存在,也可以不使用任何持久化!

4、同时开启两种持久化方式

  • 在这种情况下,当redis重启的时候会优先载入AOF文件来恢复原始的数据,因为在通常情况下AOF文件保存的数据集要比RDB文件保存的数据集要更完整。
  • RDB的数据不实时,同时使用两者时服务器重启也只会找AOF文件,那要不要只使用AOF呢?建议不要,因为RDB更适合用于备份数据库(AOF在不断变化不好备份),快速重启,而且不会有AOF可能潜在的Bug,留着作为一个万一的手段。

5、性能建议

  • 因为RDB文件只用作备用,建议只在Slave上持久化RDB文件,而且只要15分钟备份一次就够了,只保留save 900 1这条规则!
  • 如果Enable AOF,好处是在最恶劣情况下也指挥丢失不超过2秒数据,启动脚本较简单只load自己的AOF文件即可,代价一是带来了持续的IO,二是AOF rewrite的最后将rewrite过程中产生的新数据写到新文件几乎是不可避免的。只要硬盘许可,应该尽量减少AOF rewrite的频率,AOF重写的基础大小默认64M,太小,可以设定到5G以上,默认超过原大小100%大小重写可以改到适当的数值。
  • 如果不Enable AOF,仅靠Master-Slave Replication实现高可用性也可以,能省掉一大笔IO,也减少了rewrite时带来的系统波动。代价时如果Master/Slave同时宕机,会丢失十几分钟的数据,启动脚本也要比较两个Master/Slave的RDB文件,载入最新的那个。

三、Redis发布订阅

Redis发布订阅(pub/sub)是一种消息通信模式:发送者(pub)发送消息,订阅者(sub)接受消息。

Redis客户端可以订阅任意数量的频道!

  • 消息发送者
  • 频道
  • 消息订阅者

在这里插入图片描述

下图展示消息订阅者与频道之间的关系

在这里插入图片描述

当有新消息通过PUBLISH命令发送给频道时,这个消息就会被发送给订阅它的三个客户端

在这里插入图片描述

常用命令

这些命令被广泛应用于构建即时通信应用,比如网络聊天室(chatroom)和实时广播、实时提醒等

1635684708812

测试

订阅端:

1
2
3
4
5
6
7
8
9
10
11
12
127.0.0.1:6378> subscribe ldg # 订阅一个频道 ldg
Reading messages... (press Ctrl-C to quit)
1) "subscribe"
2) "ldg"
3) (integer) 1
# 等待读取推送的消息
1) "message" # 消息
2) "ldg" # 哪个频道的消息
3) "hello,ldg" # 消息的具体内容
1) "message"
2) "ldg"
3) "hello,redis"

发送端:

1
2
3
4
127.0.0.1:6378> publish ldg "hello,ldg" # 发布者发布消息到频道!
(integer) 1
127.0.0.1:6378> publish ldg "hello,redis" # 发布者发布消息到频道!
(integer) 1

原理

Redis通过PUBLISH、SUBSCRIBE和PSUBSCRIBE等命令实现发布和订阅功能!

通过SUBSCRIBE命令订阅某频道后,redis-server里维护了一个字典,字典的键就是一个个频道!而字典的值则时一个链表,链表中保存了所有订阅这个channel的客户端。SUBSCRIBE命令的关键,就是将客户端添加到给定的channel的订阅链表中。

通过PUBLISH命令向订阅者发送消息,redis-server会使用给定的频道作为键,在它维护的channel字典中查找记录了订阅这个频道的所有客户端的链表,遍历这个链表,将消息发布给所有订阅者。

Pub/Sub从字面上理解就是发布(Publish)与订阅(Subscribe),在Redis中,你可以设定对某一个key值进行消息发布及消息订阅,当一个key值上进行了消息发布后,所有订阅它的客户端都会收到相应的消息。这一功能最明显的用法就是用作实时消息系统,比如普通的即时聊天,群聊等功能。

使用场景:

  1. 实时消息系统!
  2. 实时聊天!(频道当作聊天室,将信息回显给所有人即可)
  3. 订阅、关注系统都是可以的!

稍微复杂的场景就可以使用消息中间件MQ!

四、主从复制

概念

主从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器。前者称为主节点(master/leader),后者称为节点(slave/follower);数据的复制是单向的,只能由主节点到从节点。Master以写为主,Slave以读为主。

默认情况下,每台Redis服务器都是主节点;且一个和主节点可以有多个从节点(或没有从节点),但一个从节点只能有一个主节点。

主从复制的作用主要包括:

  1. 数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
  2. 故障恢复:当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务的冗余。
  3. 负载均衡:在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务(即写Redis数据时应用连接主节点,读Redis数据时应用连接从节点),分担服务器负载;尤其是在写少读多的场景下,通过多个从节点分担读负载,可以大大提高Redis服务器的并发量。
  4. 高可用基石:除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础。

一般来说,要将Redis运用于工程项目中,只使用一台Redis是万万不能的,原因如下:

  1. 从结构上,单个Redis服务器会发生单点故障,并且一台服务器需要处理所有的请求负载,压力较大
  2. 从容量上,单个Redis服务器内存容量有限,就算一台Redis服务器内存容量为256G,也不能将所有内存用作Redis存储内存,一般来说,单台Redis最大使用内存不应该超过20G。

对于多读少写的情景,我们可以使用如下结构:

1635686527954

主从复制,读写分析!80%的情况下都是在进行读操作!减缓服务器的压力!架构中经常使用!

环境配置

只配置从库,不用配置主库

1
2
3
4
5
6
7
8
9
10
11
12
13
127.0.0.1:6378> info replication # 查看当前库的信息
# Replication
role:master # 角色 master
connected_slaves:0 # 没有从机
master_failover_state:no-failover
master_replid:e2404176593a6d49a7dd3121f47b66b02b9b4c4b
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:0
second_repl_offset:-1
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0

1、复制3个配置文件

1635688077917

2、修改复制的3个文件的配置信息,以80为例,其他的类似

1
2
3
4
port 6380 # 修改端口
pidfile /var/run/redis_6380.pid # 修改pid名称
logfile "6380.log" # 修改日志信息名称
dbfilename dump6380.rdb # 修改rdb文件名

3、修改完毕后,启动服务,查看Redis进程

1
ps -ef | grep redis

1635688292754

一主二从

默认情况下,每台Redis服务器都是主节点;我们一般情况下只用配置从机就好了! 认老大!一主(80)而从(81、82)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
127.0.0.1:6381> slaveof 127.0.0.1 6380 # slaveof host 6380 找谁当自己的老大
OK
127.0.0.1:6381> info replication
# Replication
role:slave # 当前角色是从机
master_host:127.0.0.1 # 可以看到主机的信息
master_port:6380
master_link_status:up
master_last_io_seconds_ago:2
master_sync_in_progress:0
slave_read_repl_offset:14
slave_repl_offset:14
slave_priority:100
slave_read_only:1
replica_announced:1
connected_slaves:0
master_failover_state:no-failover
master_replid:ff6e5e9671ee0286ef57caa32c51687d410e66f0
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:14
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576

# 在主机中查看
127.0.0.1:6380> info replication
# Replication
role:master
connected_slaves:1 # 多了从机的配置
slave0:ip=127.0.0.1,port=6381,state=online,offset=126,lag=1 # 多了从机的配置
master_failover_state:no-failover
master_replid:ff6e5e9671ee0286ef57caa32c51687d410e66f0
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:126
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:126
如果两个都配置完了,在主机信息中查看就会有两个从机了!
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
127.0.0.1:6380> info replication
# Replication
role:master
connected_slaves:2
slave0:ip=127.0.0.1,port=6381,state=online,offset=420,lag=1
slave1:ip=127.0.0.1,port=6382,state=online,offset=420,lag=1
master_failover_state:no-failover
master_replid:ff6e5e9671ee0286ef57caa32c51687d410e66f0
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:420
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:420
真实的主从配置应该在配置文件中配置,这样的话就是永久的,这里使用的命令是暂时的 ![1635690495025](Redis学习(四)之持久化、缓存雪崩穿透/1635690495025.png) > 细节 主机可以写,从机不能写只能读!主机中的所有信息和数据,都会自动被从机保存! 主机写! ![1635690608059](Redis学习(四)之持久化、缓存雪崩穿透/1635690608059.png) 从机只能读,不能写! ![1635690592228](Redis学习(四)之持久化、缓存雪崩穿透/1635690592228.png) 测试:主机断开连接,从机依旧连接到主机,但是没有写操作,这时候,如果主机恢复,从机依旧可以直接获取到主机写的信息。 如果是使用命令行,配置的主从,这个时候从机如果重启,则从机会变为主机!只要变为从机,立马就会从主机中获取值! > 复制原理 Slave启动成功连接到master后会发送一个sync同步命令 Master接到命令,启动后台的存盘进程,同时收集所有接收到的用于修改数据集的命令,在后台进程执行完毕之后,master将传送这个数据文件到slave,并完成一次完全同步。
  • 全量复制:Slave服务在接收到数据库文件数据后,将其存盘并加载到内存中。
  • 增量复制:Master继续将新的所有收集到的修改命令依次传给Slave,完成同步。

但是只要是重新连接master,一次完全同步(全量复制)将被自动执行!我们的数据一定可以在从机中看到!

层层链路

上一个M连接下一个S,这个时候也能完成主从复制

1635692113451

如果主机(80)宕机,这个时候能不能自动选择一个从机当主机?可以手动执行!

如果主机断开了连接,我们可以使用slaveof no one让自己变成主机!其他的节点就可以手动连接到最新的这个主节点(手动)!如果这个时候主机(80)恢复,那就要重新连接!

哨兵模式

自动选举老大的模式

概述

主从切换技术的方法是:当主服务器宕机后,需要手动把一台从服务器切换为主服务器,这就需要人工干预,费时费力,还会造成一段时间内服务不可用。这不是一种推荐的方式,更多时候,我们优先考虑哨兵模式。Redis从2.8开始正式提供了Sentinel(哨兵)架构来解决这个问题!

哨兵模式能够后台监控主机是否故障,如果故障了,根据投票数自动将从库转换为主库。

哨兵模式是一种特殊的模式,首先Redis提供了哨兵的命令,哨兵是一个独立的进程,作为进程,它会独立运行。其原理是哨兵通过发送命令,等待Redis服务器相应,从而监控运行的多个Redis实例。

1635692113451

这里的哨兵有两个作用:

  • 通过发送命令,让Redis服务器返回监控其运行状态,包括主服务器和从服务器
  • 当哨兵检测到master宕机,会自动将slave切换成master,然后通过发布订阅模式通知其他的从服务器,修改配置文件,让它们切换为主机。

然而一个哨兵进程对Redis服务器进行监控,可能会出现问题,为此,我们可以使用多个哨兵进行监控。各个哨兵之间还会进行监控,这样就形成了多哨兵模式。

1635692113451

假设主服务器宕机,哨兵1先检测到这个结果,系统并不会马上进行failover过程,仅仅是哨兵1主观的认为主服务器不可用,这个现象称为主观下线。当后面的哨兵也检测到主服务器不可用,并且数量达到一定值时,那么哨兵之间就会进行一次投票,投票的结果由一个哨兵发起,进行failover[故障转移]操作。切换成功后,就会通过发布订阅模式,让各个哨兵把自己监控的从服务器切换为主服务器,这个过程称为客观下线

测试!

我们目前的状态是一主二从(80主机、81、82从机)

1、配置哨兵配置文件

新建sentinel.conf文件

1
2
# sentinel monitor 被监控的名称 127.0.0.1 6380 1
sentinel monitor myredis 127.0.0.1 6380 1

后面的这个数字1,代表1个哨兵认为主机宕机,主机才算真的宕机!

2、启动哨兵

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
[root@VM-4-7-centos bin]# redis-sentinel redis_config/sentinet.conf  # 启动
8745:X 31 Oct 2021 23:25:54.974 # oO0OoO0OoO0Oo Redis is starting oO0OoO0OoO0Oo
8745:X 31 Oct 2021 23:25:54.974 # Redis version=6.2.6, bits=64, commit=00000000, modified=0, pid=8745, just started
8745:X 31 Oct 2021 23:25:54.974 # Configuration loaded
8745:X 31 Oct 2021 23:25:54.975 * monotonic clock: POSIX clock_gettime
_._
_.-``__ ''-._
_.-`` `. `_. ''-._ Redis 6.2.6 (00000000/0) 64 bit
.-`` .-```. ```\/ _.,_ ''-._
( ' , .-` | `, ) Running in sentinel mode
|`-._`-...-` __...-.``-._|'` _.-'| Port: 26379
| `-._ `._ / _.-' | PID: 8745
`-._ `-._ `-./ _.-' _.-'
|`-._`-._ `-.__.-' _.-'_.-'|
| `-._`-._ _.-'_.-' | https://redis.io
`-._ `-._`-.__.-'_.-' _.-'
|`-._`-._ `-.__.-' _.-'_.-'|
| `-._`-._ _.-'_.-' |
`-._ `-._`-.__.-'_.-' _.-'
`-._ `-.__.-' _.-'
`-._ _.-'
`-.__.-'

8745:X 31 Oct 2021 23:25:54.976 # WARNING: The TCP backlog setting of 511 cannot be enforced because /proc/sys/net/core/somaxconn is set to the lower value of 128.
8745:X 31 Oct 2021 23:25:54.982 # Sentinel ID is a314f11191e5cf113a352a7cf2a5b77a5328149f
8745:X 31 Oct 2021 23:25:54.982 # +monitor master myredis 127.0.0.1 6380 quorum 1
8745:X 31 Oct 2021 23:25:54.982 * +slave slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6380
8745:X 31 Oct 2021 23:25:54.987 * +slave slave 127.0.0.1:6382 127.0.0.1 6382 @ myredis 127.0.0.1 6380

如果Master节点宕机,这个时候就会从从机中随机选择一个服务器作为主机(这里有一个投票算法!)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
# redis-sentinel redis_config/sentinet.conf 启动后的监控输出
8745:X 31 Oct 2021 23:27:56.442 # +sdown master myredis 127.0.0.1 6380
8745:X 31 Oct 2021 23:27:56.442 # +odown master myredis 127.0.0.1 6380 #quorum 1/1
8745:X 31 Oct 2021 23:27:56.442 # +new-epoch 1
8745:X 31 Oct 2021 23:27:56.442 # +try-failover master myredis 127.0.0.1 6380
8745:X 31 Oct 2021 23:27:56.448 # +vote-for-leader a314f11191e5cf113a352a7cf2a5b77a5328149f 1
8745:X 31 Oct 2021 23:27:56.448 # +elected-leader master myredis 127.0.0.1 6380
8745:X 31 Oct 2021 23:27:56.448 # +failover-state-select-slave master myredis 127.0.0.1 6380
8745:X 31 Oct 2021 23:27:56.500 # +selected-slave slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6380
8745:X 31 Oct 2021 23:27:56.500 * +failover-state-send-slaveof-noone slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6380 # 故障转移
8745:X 31 Oct 2021 23:27:56.583 * +failover-state-wait-promotion slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6380
8745:X 31 Oct 2021 23:27:57.247 # +promoted-slave slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6380
8745:X 31 Oct 2021 23:27:57.247 # +failover-state-reconf-slaves master myredis 127.0.0.1 6380
8745:X 31 Oct 2021 23:27:57.318 * +slave-reconf-sent slave 127.0.0.1:6382 127.0.0.1 6382 @ myredis 127.0.0.1 6380
8745:X 31 Oct 2021 23:27:58.272 * +slave-reconf-inprog slave 127.0.0.1:6382 127.0.0.1 6382 @ myredis 127.0.0.1 6380
8745:X 31 Oct 2021 23:27:58.272 * +slave-reconf-done slave 127.0.0.1:6382 127.0.0.1 6382 @ myredis 127.0.0.1 6380
8745:X 31 Oct 2021 23:27:58.343 # +failover-end master myredis 127.0.0.1 6380
8745:X 31 Oct 2021 23:27:58.343 # +switch-master myredis 127.0.0.1 6380 127.0.0.1 6381
8745:X 31 Oct 2021 23:27:58.343 * +slave slave 127.0.0.1:6382 127.0.0.1 6382 @ myredis 127.0.0.1 6381
8745:X 31 Oct 2021 23:27:58.343 * +slave slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6381
8745:X 31 Oct 2021 23:28:28.364 # +sdown slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6381 # 6380宕机,自动选择6381作为主机

1635694197476

如果主机(80)此时回来了,只能归并到新的主机下,当作从机,这就是哨兵模式的规则!

81主机信息:由于80(主机)宕机,81自动切换为主机

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
127.0.0.1:6381> info replication
# Replication
role:master
connected_slaves:2 # 80恢复,自动归并到81主机下
slave0:ip=127.0.0.1,port=6382,state=online,offset=21509,lag=0
slave1:ip=127.0.0.1,port=6380,state=online,offset=21509,lag=0
master_failover_state:no-failover
master_replid:a08753e9b2aa55c5e743f472050cbfbc2cc3fb89
master_replid2:97cda88fbc38088f30f87455d36ec0dac75dc9f6
master_repl_offset:21509
second_repl_offset:6490
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:21509

80恢复后,自动归并到81主机下

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
127.0.0.1:6380> info replication
# Replication
role:slave # 角色 从机
master_host:127.0.0.1
master_port:6381
master_link_status:up
master_last_io_seconds_ago:1
master_sync_in_progress:0
slave_read_repl_offset:21099
slave_repl_offset:21099
slave_priority:100
slave_read_only:1
replica_announced:1
connected_slaves:0
master_failover_state:no-failover
master_replid:a08753e9b2aa55c5e743f472050cbfbc2cc3fb89
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:21099
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:19597
repl_backlog_histlen:1503

哨兵的监控日志:

1
2
8745:X 31 Oct 2021 23:31:04.170 # -sdown slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6381
8745:X 31 Oct 2021 23:31:14.137 * +convert-to-slave slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6381

优点:

1、哨兵集群,基于主从复制模式,所有的主从配置优点,它全有

2、主从可以切换,故障可以转移,系统的可用性就会更好

3、哨兵模式就是主从模式的升级i,手动到自动,更加健壮!

缺点:

1、Redis不好实现在线扩容,集群容量一旦到达上限,在线扩容就十分麻烦!

2、实现哨兵模式的配置是很麻烦的,里面有很多的选择!

哨兵模式的全部配置

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
# Example sentinel.conf

# 哨兵sentinel实例运行的端口 默认26379
port 26379

# 哨兵sentinel的工作目录
dir /tmp

# 哨兵sentinel监控的redis主节点的 ip port
# master-name 可以自己命名的主节点名字 只能由字母A-z、数字0-9 、这三个字符".-_"组成。
# quorum 当这些quorum个数sentinel哨兵认为master主节点失联 那么这时 客观上认为主节点失联了
# sentinel monitor <master-name> <ip> <redis-port> <quorum>
sentinel monitor mymaster 127.0.0.1 6379 1

# 当在Redis实例中开启了requirepass foobared 授权密码 这样所有连接Redis实例的客户端都要提供密码
# 设置哨兵sentinel 连接主从的密码 注意必须为主从设置一样的验证密码
# sentinel auth-pass <master-name> <password>
sentinel auth-pass mymaster MySUPER--secret-0123passw0rd


# 指定多少毫秒之后 主节点没有应答哨兵sentinel 此时 哨兵主观上认为主节点下线 默认30秒
# sentinel down-after-milliseconds <master-name> <milliseconds>
sentinel down-after-milliseconds mymaster 30000

# 这个配置项指定了在发生failover主备切换时最多可以有多少个slave同时对新的master进行 同步,
# 这个数字越小,完成failover所需的时间就越长,
# 但是如果这个数字越大,就意味着越 多的slave因为replication而不可用。
# 可以通过将这个值设为 1 来保证每次只有一个slave 处于不能处理命令请求的状态。
# sentinel parallel-syncs <master-name> <numslaves>
sentinel parallel-syncs mymaster 1



# 故障转移的超时时间 failover-timeout 可以用在以下这些方面:
#1. 同一个sentinel对同一个master两次failover之间的间隔时间。
#2. 当一个slave从一个错误的master那里同步数据开始计算时间。直到slave被纠正为向正确的master那里同步数据时。
#3.当想要取消一个正在进行的failover所需要的时间。
#4.当进行failover时,配置所有slaves指向新的master所需的最大时间。不过,即使过了这个超时,slaves依然会被正确配置为指向master,但是就不按parallel-syncs所配置的规则来了
# 默认三分钟
# sentinel failover-timeout <master-name> <milliseconds>
sentinel failover-timeout mymaster 180000

# SCRIPTS EXECUTION

#配置当某一事件发生时所需要执行的脚本,可以通过脚本来通知管理员,例如当系统运行不正常时发邮件通知相关人员。
#对于脚本的运行结果有以下规则:
#若脚本执行后返回1,那么该脚本稍后将会被再次执行,重复次数目前默认为10
#若脚本执行后返回2,或者比2更高的一个返回值,脚本将不会重复执行。
#如果脚本在执行过程中由于收到系统中断信号被终止了,则同返回值为1时的行为相同。
#一个脚本的最大执行时间为60s,如果超过这个时间,脚本将会被一个SIGKILL信号终止,之后重新执行。

#通知型脚本:当sentinel有任何警告级别的事件发生时(比如说redis实例的主观失效和客观失效等等),将会去调用这个脚本,
#这时这个脚本应该通过邮件,SMS等方式去通知系统管理员关于系统不正常运行的信息。调用该脚本时,将传给脚本两个参数,
#一个是事件的类型,
#一个是事件的描述。
#如果sentinel.conf配置文件中配置了这个脚本路径,那么必须保证这个脚本存在于这个路径,并且是可执行的,否则sentinel无法正常启动成功。
#通知脚本
# sentinel notification-script <master-name> <script-path>
sentinel notification-script mymaster /var/redis/notify.sh

# 客户端重新配置主节点参数脚本
# 当一个master由于failover而发生改变时,这个脚本将会被调用,通知相关的客户端关于master地址已经发生改变的信息。
# 以下参数将会在调用脚本时传给脚本:
# <master-name> <role> <state> <from-ip> <from-port> <to-ip> <to-port>
# 目前<state>总是“failover”,
# <role>是“leader”或者“observer”中的一个。
# 参数 from-ip, from-port, to-ip, to-port是用来和旧的master和新的master(即旧的slave)通信的
# 这个脚本应该是通用的,能被多次调用,不是针对性的。
# sentinel client-reconfig-script <master-name> <script-path>
sentinel client-reconfig-script mymaster /var/redis/reconfig.sh

五、Redis缓存穿透和雪崩(重点)

Redis缓存的使用,极大的提升了应用程序的性能和效率,特别是数据查询方面,但同时,它也带来了一些问题。其中,最要害的问题,就是数据一致性问题,从严格意义上讲,这个问题误解,如果对数据的一致性要求很高,那么就不能使用缓存。

缓存穿透(查不到)

概念

用户想要查询一个数据,发现redis内存数据库中没有,也就是缓存没有命中,于是向持久层数据库查询,发现也没有,于是本次查询失败。当用户很多的时候,缓存都没有命中,于是都去请求了持久层数据库。这会给持久层数据库造成很大的压力,这时候就相当于出现了缓存穿透。

1636279687055

解决方案

布隆过滤器(后续待学习)

布隆过滤器是一种数据结构,对所有可能查询的参数以hash形式存储,在控制层先进行校验,不符合则丢弃,从而避免了对底层存储系统的查询压力。

缓存空对象

当存储层不命中后,即使返回的空对象也将其存储起来,同时会设置一个过期时间,之后在访问这个数据将会从缓存中获取,保护了后端数据源。

但是这种方法会存在两个问题:

  1. 如果空值能够被缓存起来,这就意味着缓存需要更多的空间存储更多的键,因为这当中可能会有很多的控制的键。
  2. 即使对控制设置了过期时间,还是会存在缓存层和存储层的数据会有一段时间窗口的不一致,这对于需要保持一致性的业务会有影响。

缓存击穿(量太大,缓存过期)

微博服务宕机

概述

需要注意和缓存穿透的区别,缓存击穿,是指一个key非常热点,在不停的扛着大并发,大并发集中对这一个点进行访问,当这个key在失效的期间,持续的大并发就会穿破缓存,直接请求到数据库,就像在一个屏障上凿开了一个洞。

当某个key在过期的瞬间,有大量的请求并发访问,这类数据一般是热点数据,由于缓存过期,会同时访问数据库来查询最新数据,并且回写缓存,会导致数据库瞬间压力过大。

解决方案

设置热点数据永不过期

从缓存层面看,没有设置过期时间,所以不会出现热点key过期后产生的问题。

加互斥锁(待学习)

分布式锁:使用分布式锁,保证对于每个key同时只有一个线程去查询后端服务,其他线程没有获得分布式锁的权限,因此只需要等待即可。这种方式将高并发的压力转移到了分布式锁,因此对分布式锁的考验很大。

缓存雪崩

概念

缓存雪崩,是指在某一个时间段,缓存集中过期失效。Redis宕机!

产生雪崩的原因之一,比如在写文本的时候,马上要到双十一零点,很快就会迎来一波抢购,这波商品时间比较集中的放入了缓存,假设缓存一个小时,那么到了凌晨一点的时候,这批商品的缓存就都过期了。而对这批商品的访问查询,都落到了数据库上,对于数据库而言,就会产生周期性的压力波峰。于是所有的请求都会达到存储层,存储层的调用量会暴增,造成存储层也会挂掉的情况。

其实集中过期,倒不是非常致命,比较致命的是缓存雪崩,是缓存服务器某个节点宕机或断网。因为自然形成的缓存雪崩,一定是在某个时间段集中创建缓存,这个时候,数据库是可以顶住压力的。无非就是对数据库产生周期性的压力而已。而缓存服务节点的宕机,对数据库服务器造成的压力是不可预知的,很有可能瞬间就把数据库压垮。

双十一:停掉一些服务,保证主要的服务可用!

解决方案

Redis高可用

既然redis有可能挂掉,可以多增设几台redis,这样一台挂掉之后其他还可以继续工作,也就是搭建集群(异地多活),

限流降级

这个解决方案的思想是,在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量。比如对某个key只允许一个线程查询数据和写缓存,其他线程等待。

数据预热

数据预热的含义是在正式部署之前,先把可能的数据预先访问一遍,这样部分可能大量访问的数据就会加载到缓存中。在即将发生大并发访问前手动触发加载缓存不同的key,设置不同的过期时间,让缓存失效的时间尽量均匀。

0%