一、Redis.conf详解
启动的时候,通过配置文件来启动
单位
配置文件unit单位对大小写不敏感
包含
就好比我们学习Spring的Import和include
网络
1 | bind 0.0.0.0 -::1 # 绑定的ip,设置为0.0.0.0 即没有绑定IP |
通用 GENERAL
1 | daemonize yes # 以守护进程的方式运行,默认是no,我们需要自己开启为yes! |
快照
持久化,在规定的时间内,执行了多少次操作,则会持久化到文件.rdb、.aof
Redis是内存数据库,如果没有持久化,那么数据断电即失
1 | # 如果3600秒内,如果至少有1个key进行了修改,我们及时进行持久化操作 |
REPLICATION 复制
SECURITY安全
可以设置redis的密码,默认是没有密码的!
1 | 127.0.0.1:6378> ping |
限制 CLIENTS
1 | maxclients 10000 # 设置能连接上redis的最大客户端的数量 |
APPEND ONLY MODE 模式,aof配置
1 | appendonly no # 默认是不开启aof模式的,默认是使用rdb方式持久化,在大部分所有的情况下,rdb完全够用! |
二、Redis持久化
Redis是内存数据库,如果不将内存中的数据库状态保存到磁盘,那么一旦服务器进程退出,服务器中的数据库状态也会消失。所以Redis提供了持久化功能!
RDB(Redis DataBase)
什么是RDB
在主从复制中,rdb就是备用在从机上面!
在指定的时间间隔内,将内存中的数据集快照写入磁盘,也就是Snapshot快照,它恢复时将快照文件直接读到内存中。
Redis会单独创建(fork)一个子进程来持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,子进程是不进行任何IO操作的。这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。我们默认的就是RDB,一般情况下不需要修改这个配置!
rdb保存的文件是dump.rdb触发机制
1、save的规则满足的情况下,会触发rdb规则!
如:上面设置ide60s内修改了5次key,则会生成rdb文件
2、执行flushall命令,也会触发我们的rdb规则!
如:先将目录下的rdb文件删除,执行flushall命令,会生成rdb文件
3、退出redis,也会产生rdb文件!
备份就自动生成一个dump.rdb!
如何恢复rdb文件!
1、只需要将rdb文件放在我们redis启动目录就可以,redis启动的时候会自动检查dump.rdb并恢复其中的数据!
2、查看需要存在的位置
1 | 127.0.0.1:6378> config get dir |
优点:
1、适合大规模的数据恢复!
2、对数据的完整性要求不高!
缺点:
1、需要一定的时间间隔进行操作!如果redis意外宕机,这个最后一次修改的数据就没有!
2、fork进程的时候,会占用一定的内存空间!
AOF(Append Only File)
将我们的所有命令都记录下来,恢复的时候就把这个文件全部在执行一遍!
是什么
以日志的形式来记录每个写操作,将Redis执行过的所有指令记录下来(读操作不记录),只允许追加文件但不可以改写文件,redis启动之初会读取该文件重新构建数据,换言之,redis重启的话,就会根据日志文件的内容将写指令从前到后执行一次,以完成数据的恢复工作!
AOF保存的是appendonly.aof文件默认是不开启的,需要手动进行配置!只需将appendonly 修改为yes。
重启,Redis即可生效!
重新连接redis则会报错
如果这个aof文件有错位,这时候redis是启动不成功,我们需要修复这个aof文件,使用如下命令进行修复
1 | redis-check-aof --fix appendonly.aof # 修复aof文件中的错位 |
1 | [root@VM-4-7-centos bin]# redis-check-aof --fix appendonly.aof |
重启Redis即可成功!
重写规则说明
aof默认的就是文件的无限追加,文件会越来越大!
如果aof文件大于64M,太大了,父进程会fork一个新的进程来将我们的文件进行重写!
优缺点
优点:
1、每一次修改都同步,文件的完整性会更加好!
2、每秒同步一次,可能会丢失一秒的数据
3、从不同步,效率最高!
缺点:
1、相对于数据文件来说,aof远远大于rdb,修复的速度也比rdb慢!
2、aof运行效率也比rdb慢,所以我们Redis默认的配置就是rdb持久化,而不是aof
扩展
1、RDB持久化方式能够在指定的时间间隔内对数据进行快照存储!
2、AOF持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF命令以Redis协议追加保存每次写的操作到文件末尾,Redis还能对AOF文件进行后台重写,使得AOF文件的体积不至于过大!
3、只做缓存,如果你只希望你的数据在服务器运行的时候存在,也可以不使用任何持久化!
4、同时开启两种持久化方式
- 在这种情况下,当redis重启的时候会优先载入AOF文件来恢复原始的数据,因为在通常情况下AOF文件保存的数据集要比RDB文件保存的数据集要更完整。
- RDB的数据不实时,同时使用两者时服务器重启也只会找AOF文件,那要不要只使用AOF呢?建议不要,因为RDB更适合用于备份数据库(AOF在不断变化不好备份),快速重启,而且不会有AOF可能潜在的Bug,留着作为一个万一的手段。
5、性能建议
- 因为RDB文件只用作备用,建议只在Slave上持久化RDB文件,而且只要15分钟备份一次就够了,只保留save 900 1这条规则!
- 如果Enable AOF,好处是在最恶劣情况下也指挥丢失不超过2秒数据,启动脚本较简单只load自己的AOF文件即可,代价一是带来了持续的IO,二是AOF rewrite的最后将rewrite过程中产生的新数据写到新文件几乎是不可避免的。只要硬盘许可,应该尽量减少AOF rewrite的频率,AOF重写的基础大小默认64M,太小,可以设定到5G以上,默认超过原大小100%大小重写可以改到适当的数值。
- 如果不Enable AOF,仅靠Master-Slave Replication实现高可用性也可以,能省掉一大笔IO,也减少了rewrite时带来的系统波动。代价时如果Master/Slave同时宕机,会丢失十几分钟的数据,启动脚本也要比较两个Master/Slave的RDB文件,载入最新的那个。
三、Redis发布订阅
Redis发布订阅(pub/sub)是一种消息通信模式:发送者(pub)发送消息,订阅者(sub)接受消息。
Redis客户端可以订阅任意数量的频道!
- 消息发送者
- 频道
- 消息订阅者
下图展示消息订阅者与频道之间的关系
当有新消息通过PUBLISH命令发送给频道时,这个消息就会被发送给订阅它的三个客户端
常用命令
这些命令被广泛应用于构建即时通信应用,比如网络聊天室(chatroom)和实时广播、实时提醒等
测试
订阅端:
1 | 127.0.0.1:6378> subscribe ldg # 订阅一个频道 ldg |
发送端:
1 | 127.0.0.1:6378> publish ldg "hello,ldg" # 发布者发布消息到频道! |
原理
Redis通过PUBLISH、SUBSCRIBE和PSUBSCRIBE等命令实现发布和订阅功能!
通过SUBSCRIBE命令订阅某频道后,redis-server里维护了一个字典,字典的键就是一个个频道!而字典的值则时一个链表,链表中保存了所有订阅这个channel的客户端。SUBSCRIBE命令的关键,就是将客户端添加到给定的channel的订阅链表中。
通过PUBLISH命令向订阅者发送消息,redis-server会使用给定的频道作为键,在它维护的channel字典中查找记录了订阅这个频道的所有客户端的链表,遍历这个链表,将消息发布给所有订阅者。
Pub/Sub从字面上理解就是发布(Publish)与订阅(Subscribe),在Redis中,你可以设定对某一个key值进行消息发布及消息订阅,当一个key值上进行了消息发布后,所有订阅它的客户端都会收到相应的消息。这一功能最明显的用法就是用作实时消息系统,比如普通的即时聊天,群聊等功能。
使用场景:
- 实时消息系统!
- 实时聊天!(频道当作聊天室,将信息回显给所有人即可)
- 订阅、关注系统都是可以的!
稍微复杂的场景就可以使用消息中间件MQ!
四、主从复制
概念
主从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器。前者称为主节点(master/leader),后者称为节点(slave/follower);数据的复制是单向的,只能由主节点到从节点。Master以写为主,Slave以读为主。
默认情况下,每台Redis服务器都是主节点;且一个和主节点可以有多个从节点(或没有从节点),但一个从节点只能有一个主节点。
主从复制的作用主要包括:
- 数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
- 故障恢复:当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务的冗余。
- 负载均衡:在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务(即写Redis数据时应用连接主节点,读Redis数据时应用连接从节点),分担服务器负载;尤其是在写少读多的场景下,通过多个从节点分担读负载,可以大大提高Redis服务器的并发量。
- 高可用基石:除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础。
一般来说,要将Redis运用于工程项目中,只使用一台Redis是万万不能的,原因如下:
- 从结构上,单个Redis服务器会发生单点故障,并且一台服务器需要处理所有的请求负载,压力较大
- 从容量上,单个Redis服务器内存容量有限,就算一台Redis服务器内存容量为256G,也不能将所有内存用作Redis存储内存,一般来说,单台Redis最大使用内存不应该超过20G。
对于多读少写的情景,我们可以使用如下结构:
主从复制,读写分析!80%的情况下都是在进行读操作!减缓服务器的压力!架构中经常使用!
环境配置
只配置从库,不用配置主库
1 | 127.0.0.1:6378> info replication # 查看当前库的信息 |
1、复制3个配置文件
2、修改复制的3个文件的配置信息,以80为例,其他的类似
1 | port 6380 # 修改端口 |
3、修改完毕后,启动服务,查看Redis进程
1 | ps -ef | grep redis |
一主二从
默认情况下,每台Redis服务器都是主节点;我们一般情况下只用配置从机就好了! 认老大!一主(80)而从(81、82)1 | 127.0.0.1:6381> slaveof 127.0.0.1 6380 # slaveof host 6380 找谁当自己的老大 |
1 | 127.0.0.1:6380> info replication |
- 全量复制:Slave服务在接收到数据库文件数据后,将其存盘并加载到内存中。
- 增量复制:Master继续将新的所有收集到的修改命令依次传给Slave,完成同步。
但是只要是重新连接master,一次完全同步(全量复制)将被自动执行!我们的数据一定可以在从机中看到!
层层链路
上一个M连接下一个S,这个时候也能完成主从复制
如果主机(80)宕机,这个时候能不能自动选择一个从机当主机?可以手动执行!
如果主机断开了连接,我们可以使用slaveof no one让自己变成主机!其他的节点就可以手动连接到最新的这个主节点(手动)!如果这个时候主机(80)恢复,那就要重新连接!
哨兵模式
自动选举老大的模式
概述
主从切换技术的方法是:当主服务器宕机后,需要手动把一台从服务器切换为主服务器,这就需要人工干预,费时费力,还会造成一段时间内服务不可用。这不是一种推荐的方式,更多时候,我们优先考虑哨兵模式。Redis从2.8开始正式提供了Sentinel(哨兵)架构来解决这个问题!
哨兵模式能够后台监控主机是否故障,如果故障了,根据投票数自动将从库转换为主库。
哨兵模式是一种特殊的模式,首先Redis提供了哨兵的命令,哨兵是一个独立的进程,作为进程,它会独立运行。其原理是哨兵通过发送命令,等待Redis服务器相应,从而监控运行的多个Redis实例。
这里的哨兵有两个作用:
- 通过发送命令,让Redis服务器返回监控其运行状态,包括主服务器和从服务器
- 当哨兵检测到master宕机,会自动将slave切换成master,然后通过发布订阅模式通知其他的从服务器,修改配置文件,让它们切换为主机。
然而一个哨兵进程对Redis服务器进行监控,可能会出现问题,为此,我们可以使用多个哨兵进行监控。各个哨兵之间还会进行监控,这样就形成了多哨兵模式。
假设主服务器宕机,哨兵1先检测到这个结果,系统并不会马上进行failover过程,仅仅是哨兵1主观的认为主服务器不可用,这个现象称为主观下线。当后面的哨兵也检测到主服务器不可用,并且数量达到一定值时,那么哨兵之间就会进行一次投票,投票的结果由一个哨兵发起,进行failover[故障转移]操作。切换成功后,就会通过发布订阅模式,让各个哨兵把自己监控的从服务器切换为主服务器,这个过程称为客观下线。
测试!
我们目前的状态是一主二从(80主机、81、82从机)
1、配置哨兵配置文件
新建sentinel.conf文件
1 | # sentinel monitor 被监控的名称 127.0.0.1 6380 1 |
后面的这个数字1,代表1个哨兵认为主机宕机,主机才算真的宕机!
2、启动哨兵
1 | [root@VM-4-7-centos bin]# redis-sentinel redis_config/sentinet.conf # 启动 |
如果Master节点宕机,这个时候就会从从机中随机选择一个服务器作为主机(这里有一个投票算法!)
1 | # redis-sentinel redis_config/sentinet.conf 启动后的监控输出 |
如果主机(80)此时回来了,只能归并到新的主机下,当作从机,这就是哨兵模式的规则!
81主机信息:由于80(主机)宕机,81自动切换为主机
1 | 127.0.0.1:6381> info replication |
80恢复后,自动归并到81主机下
1 | 127.0.0.1:6380> info replication |
哨兵的监控日志:
1 | 8745:X 31 Oct 2021 23:31:04.170 # -sdown slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6381 |
优点:
1、哨兵集群,基于主从复制模式,所有的主从配置优点,它全有
2、主从可以切换,故障可以转移,系统的可用性就会更好
3、哨兵模式就是主从模式的升级i,手动到自动,更加健壮!
缺点:
1、Redis不好实现在线扩容,集群容量一旦到达上限,在线扩容就十分麻烦!
2、实现哨兵模式的配置是很麻烦的,里面有很多的选择!
哨兵模式的全部配置
1 | # Example sentinel.conf |
五、Redis缓存穿透和雪崩(重点)
Redis缓存的使用,极大的提升了应用程序的性能和效率,特别是数据查询方面,但同时,它也带来了一些问题。其中,最要害的问题,就是数据一致性问题,从严格意义上讲,这个问题误解,如果对数据的一致性要求很高,那么就不能使用缓存。
缓存穿透(查不到)
概念
用户想要查询一个数据,发现redis内存数据库中没有,也就是缓存没有命中,于是向持久层数据库查询,发现也没有,于是本次查询失败。当用户很多的时候,缓存都没有命中,于是都去请求了持久层数据库。这会给持久层数据库造成很大的压力,这时候就相当于出现了缓存穿透。
解决方案
布隆过滤器(后续待学习)
布隆过滤器是一种数据结构,对所有可能查询的参数以hash形式存储,在控制层先进行校验,不符合则丢弃,从而避免了对底层存储系统的查询压力。
缓存空对象
当存储层不命中后,即使返回的空对象也将其存储起来,同时会设置一个过期时间,之后在访问这个数据将会从缓存中获取,保护了后端数据源。
但是这种方法会存在两个问题:
- 如果空值能够被缓存起来,这就意味着缓存需要更多的空间存储更多的键,因为这当中可能会有很多的控制的键。
- 即使对控制设置了过期时间,还是会存在缓存层和存储层的数据会有一段时间窗口的不一致,这对于需要保持一致性的业务会有影响。
缓存击穿(量太大,缓存过期)
微博服务宕机
概述
需要注意和缓存穿透的区别,缓存击穿,是指一个key非常热点,在不停的扛着大并发,大并发集中对这一个点进行访问,当这个key在失效的期间,持续的大并发就会穿破缓存,直接请求到数据库,就像在一个屏障上凿开了一个洞。
当某个key在过期的瞬间,有大量的请求并发访问,这类数据一般是热点数据,由于缓存过期,会同时访问数据库来查询最新数据,并且回写缓存,会导致数据库瞬间压力过大。
解决方案
设置热点数据永不过期
从缓存层面看,没有设置过期时间,所以不会出现热点key过期后产生的问题。
加互斥锁(待学习)
分布式锁:使用分布式锁,保证对于每个key同时只有一个线程去查询后端服务,其他线程没有获得分布式锁的权限,因此只需要等待即可。这种方式将高并发的压力转移到了分布式锁,因此对分布式锁的考验很大。
缓存雪崩
概念
缓存雪崩,是指在某一个时间段,缓存集中过期失效。Redis宕机!
产生雪崩的原因之一,比如在写文本的时候,马上要到双十一零点,很快就会迎来一波抢购,这波商品时间比较集中的放入了缓存,假设缓存一个小时,那么到了凌晨一点的时候,这批商品的缓存就都过期了。而对这批商品的访问查询,都落到了数据库上,对于数据库而言,就会产生周期性的压力波峰。于是所有的请求都会达到存储层,存储层的调用量会暴增,造成存储层也会挂掉的情况。
其实集中过期,倒不是非常致命,比较致命的是缓存雪崩,是缓存服务器某个节点宕机或断网。因为自然形成的缓存雪崩,一定是在某个时间段集中创建缓存,这个时候,数据库是可以顶住压力的。无非就是对数据库产生周期性的压力而已。而缓存服务节点的宕机,对数据库服务器造成的压力是不可预知的,很有可能瞬间就把数据库压垮。
双十一:停掉一些服务,保证主要的服务可用!
解决方案
Redis高可用
既然redis有可能挂掉,可以多增设几台redis,这样一台挂掉之后其他还可以继续工作,也就是搭建集群(异地多活),
限流降级
这个解决方案的思想是,在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量。比如对某个key只允许一个线程查询数据和写缓存,其他线程等待。
数据预热
数据预热的含义是在正式部署之前,先把可能的数据预先访问一遍,这样部分可能大量访问的数据就会加载到缓存中。在即将发生大并发访问前手动触发加载缓存不同的key,设置不同的过期时间,让缓存失效的时间尽量均匀。