Redis 大型攻略之主从复制、哨兵模式、群集模式(理论详解+搭建步骤)

x33g5p2x  于2021-11-14 转载在 Redis  
字(9.0k)|赞(0)|评价(0)|浏览(448)

前言

redis群集有三种模式,分别是主从同步/复制、哨兵模式、Cluster

一、Redis主从复制

  • 通过持久化功能,redis保证了即使在服务器重启的情况下也不会丢失(或少量丢失)数据,因为持久化会把内存中的数据保存到硬盘上,重启会从硬盘上加载数据,但是由于数据是存储在一台服务器上的,如果这台服务器出现硬盘故障等问题,也会导致数据丢失
  • 喂了避免单点故障,通常的做法是将数据库复制多个副本以部署在不同服务器上,这样即使有一台服务器出现故障,其他服务器依然可以继续提供服务,为此,redis提供了复制(replication)功能,可以实现当一台数据库中的数据更新后,自动将更新的数据同步到其他数据库上
  • 在复制的概念中,数据库分为两类,一类是主数据库(master),另一类是从数据(slave)。主数据可以进行读和写操作,当写操作导致数据变化时会自动将数据同步给从数据库,而从数据库一般是只读的,并接受主数据同步过来的数据。一个主数据库可以拥有多个从数据库,而一个从数据库只能拥有一个主数据库

1.主从复制

①若启动一个slave机器进程,则它会向master机器发送一个“sync command”命令,请求同步连接

②无论是第一次连接还是重新连接,master机器都会启动一个后台进程,将数据快照(RDB)保存到数据文件中(执行RDB操作),同时master还会记录修改数据的所有命令,并缓存在数据文件中

③后台进程完成缓存操作后,master机器就会向slave机器发送数据文件,slave端机器将数据文件保存在硬盘上,然后将其加载到内存中,接着master机器就会将修改数据的所有操作一并发送给slave端机器。若slave出现故障导致宕机,则恢复正常后会自动重新连接

④master机器收到slave端机器的连接后,将其完整的数据文件发送给slave端机器,如果master同时收到多个slave发来的同步请求,则master会在后台启动一个进程以保存数据文件,然后将其发送给所有的slave端机器,确保所有的slave端机器都正常工作

二、哨兵模式

1.哨兵模式集群架构

哨兵时redis集群架构中非常重要的 一个组件,主要是解决了主从复制出现故障时需要人为干预的问题

2.哨兵模式主要功能

① 集群监控:负责监控Redismaster和slave进程是否正常工作
② 消息通知:如果某个Redis实例有故障,那么哨兵负责发送消息作为报敬通知给管理员
③ 故障转移:如果master node挂掉了,会自动转移到slave node上
④ 配置中心:如果故障转移发生了,通知client客户端新的master地址
使用一个或者多个哨兵(Sentinel)实例组成的系统,对redis节点进行监控 在主节点出现故障的情况下, 能将从节点中的一个升级为主节点,进行故障转义,保证系统的可用性。

3.哨兵监控整个系统节点的过程

① 首先主节点的信息是配置在哨兵(Sentinel)的配置文件中

② 哨兵节点会和配置的主节点建立起两条连接命令连接和订阅连接
PS:Redis发布订阅(pub/sub)是一种消息通信模式:发送者(pub)发送消 息,订阅者 (sub) 接收消息。

③ 哨兵会通过命令连接每10s发送一次INFO命令,通过INFO命令,主节点会返回自己的run_id和自己的从节点信息

④ 哨兵会对这些从节点也建立两条连接命令连接和订阅连接

⑤ 哨兵通过命令连接向从节点发送INFO命令,获取到他的一些信息:
run id(redis服务器id)
role(职能)
从服务器的复制偏移量offset
其他

⑥ 通过命令连接向服务器的sentinel:hello频道发送一条消息,内容包括自己的ip端口、run id、配置(后续投票的时候会用到)等

⑦ 通过订阅连接对服务器的sentinel:hello频道做了监听,所以所有的向该频道发送的哨兵的消息都能被接受到

⑧ 解析监听到的消息,进行分析提取,就可以知道还有那些别的哨兵服务节点也在监听这些主从节点了,更新结构体将这些
哨兵节点记录下来

⑨ 向观察到的其他的哨兵节点建立命令连接----没有订阅连接

4.哨兵模式下的故障迁移

① 主观下线

哨兵(Sentinel)节点会每秒一次的频率向建立了命令连接的实例发送PING命令,如果在down-after-milliseconds毫秒内没有做出有效响应包括(PONG/LOADING/MASTERDOWN)以外的响应,哨兵就会将该实例在本结构体中的状态标记为SRI_S_DOWN主观下线

② 客观下线

当一个哨兵节点发现主节点处于主观下线状态是,会向其他的哨兵节点发出询问,该节点是不是已经主观下线了。如果超过配置参数quorum个节点认为是主观下线时,该哨兵节点就会将自己维护的结构体中该主节点标记为SRIO DOWN客观下线询问命令SENTINEL is-master-down-by-addr

③ master选举

在认为主节点客观下线的情况下,哨兵节点节点间会发起一次选举,命令为:SENTINEL is-master-down-by-addr
只是runid这次会将自己的runid带进去,希望接受者将自己设置为主节点。如果超过半数以上的节点返回将该节点标记为leacer的情况下,会有该leader对故障进行迁移

④ 故障转移

  • 在从节点中挑选出新的主节点
    通讯正常
    优先级排序
    优先级相同时选择offset最大的
  • 将该节点设置成新的主节点SLAVEOF no one,并确保在后续的INGO命令时 该节点返回状态为master
  • 将其他的从节点设置成从新的主节点复制,SLAVEOF命令
  • 将旧的主节点变成新的主节点的从节点

PS:优缺点

  • 优点:
    高可用,哨兵模式是基于主从模式的,所有主从模式的优点,哨兵模式都具有有;主从可以自动切换,系统更
    健壮,可用性更高
  • 缺点:
    redis比较难支持在线扩容,在群集容量达到上限时在线扩容会变得很复杂

三、Cluster群集

  • 主节点负责读写请求和集群信息的维护,从节点只进行主节点数据和状态信息的复制

1.作用

① 数据分区

  • 数据分区(或称数据分片)是集群最核心的功能
  • 集群将数据分散到多个节点,一方面突破了 Redis 单机内存大小的限制,存储容量大大增加,另一方面每个主节点都可以对外提供读服务和写服务,大大提高了集群的响应能力
  • Redis 单机内存大小受限问题,在介绍持久化和主从复制时都有提及
  • 例如,如果单机内存太大,bgsave 和 bgrewriteaof 的 fork 操作可能导致主进程阻塞,主从环境下主机切换时可能导致从节点长时间无法提供服务,全量复制阶段主节点的复制缓冲区可能溢出

②高可用

  • 集群支持主从复制和主节点的自动故障转移(与哨兵类似),当任意节点发送故障时,集群仍然可以对外提供服务

③ 数据分片

  • Redis 集群引入了哈希槽的概念,有 16384 个哈希槽(编号 0~16383)
  • 集群的每个节点负责一部分哈希槽,每个 Key 通过 CRC16 校验后对 16384 取余来决定放置哪个哈希槽,通过这个值,去找到对应的插槽所对应的节点,然后直接自动跳转到这个对应的节点上进行存取操作
  • 以 3 个节点组成的集群为例:
    节点 A 包含 0~5469 号的哈希槽
    节点 B 包含 5461~10922 号的哈希槽
    节点 C 包含 10923~16383 号的哈希槽

四、项目一(主从复制)

主机IP 地址主要软件
Master192.168.126.15redis-5.0.7.tar.gz
Slave1192.168.126.11redis-5.0.7.tar.gz
Slave2192.168.126.12redis-5.0.7.tar.gz

1.安装redis

systemctl stop firewalld
systemctl disable firewalld
setenforce 0

yum -y install gcc gcc-c++ make

cd /opt
#将软件包传至该目录下
tar zxvf redis-5.0.7.tar.gz -C /opt/

cd redis-5.0.7/
make -j 4 && make PREFIX=/usr/local/redis install

cd /opt/redis-5.0.7/utils/
./install_server.sh
#回车,直到出现以下选项,手动修改为“/usr/local/redis/bin/redis-server”
Please select the redis executable path [/usr/local/bin/redis-server] /usr/local/redis/bin/redis-server

ln -s /usr/local/redis/bin/* /usr/local/bin/

netstat -natp | grep "redis"
#当 install_server.sh 脚本运行完毕,Redis 服务就已经启动,默认侦听端口为 6379

2.修改 Redis 配置文件

Master:

vim /etc/redis/6379.conf
bind 0.0.0.0                        #70行,修改监听地址为 0.0.0.0
daemonize yes                       #137行,开启守护进程
logfile /var/1og/redis_ 6379.1og    #172行,指定日志文件目录
dir /var/lib/redis/6379             #264行,指定工作目录
appendonly yes                      #700行,开启 AOF 持久化功能

Slave:

vim /etc/redis/6379. conf
bind 0.0.0.0                        #70行,修改监听地址为 0.0.0.0
daemonize yes                       #137行,开启守护进程
logfile /var/log/redis_ 6379. log   #172行,指定日志文件目录
dir /var/lib/redis/6379             #264行,指定工作目录
replicaof 192.168.126.15 6379       #288行,指定要同步的 Master 节点 IP 和端口
appendonly yes                      #700行,开启 AOF 持久化功能

/etc/init.d/redis_6379 restart
#重启服务使配置生效

3.验证主从效果

在 Master 上看日志:

tail -f /var/log/redis_6379.log

在 Master 上验证从节点:

redis-cli info replication

五、项目二(哨兵)

基于主从复制基础上搭建

①修改 Redis 配置文件(所有节点操作)

vim /opt/redis-5.0.7/sentinel.conf
#17行,关闭保护模式
protected-mode no
#21行,Redis哨兵默认的监听端口
port 26379
#26行,指定sentinel为后台启动
daemonize yes
#36行,指定日志存放路径
logfile "/var/log/sentinel.log"
#65行,指定数据库存放路径
dir "/var/lib/redis/6379"
#84行,修改 指定该哨兵节点监控192.168.163.10:6379这个主节点,该主节点的名称是mymaster,最后的2的含义与主节点的故障判定有关:至少需要2个哨兵节点同意,才能判定主节点故障并进行故障转移
sentinel monitor mymaster 192.168.126.15 6379 2
#113行,判定服务器down掉的时间周期,默认30000毫秒(30秒)
sentinel down-after-milliseconds mymaster 30000
#146行,故障节点的最大超时时间为180000(180秒)
sentinel failover-timeout mymaster 180000

②启动哨兵模式

注意:先启master,再启slave

cd /opt/redis-5.0.7/
redis-sentinel sentinel.conf &

③查看哨兵模式信息

redis-cli -p 26379 info Sentinel

④故障模拟、

Master:192.168.126.15

#查看redis-server进程号
[root@localhost redis-5.0.7]# ps aux | grep redis
root       9125  0.2  0.2 153992  7900 ?        Ssl  14:59   0:02 redis-sentinel *:26379 [sentinel]
root      27384  0.0  0.0 112824   980 pts/0    R+   15:13   0:00 grep --color=auto redis
root      87476  0.0  0.0 108092   616 pts/0    T    14:18   0:00 tail -f /var/log/redis_6379.log
root      91133  0.0  0.0 108092   616 pts/0    T    14:21   0:00 tail -f /var/log/redis_6379.log
root     100570  0.1  0.2 156552  7848 ?        Ssl  14:28   0:03 /usr/local/redis/bin/redis-server 0.0.0.0:6379
#杀死 Master 节点上redis-server的进程号,模拟故障
kill -9 100570			#Master节点上redis-server的进程号

⑤验证结果

Master:192.168.126.15

[root@localhost redis-5.0.7]# tail -f /var/log/sentinel.log
9125:X 12 Nov 2021 15:18:26.586 # +promoted-slave slave 192.168.126.12:6379 192.168.126.12 6379 @ mymaster 192.168.126.15 6379
9125:X 12 Nov 2021 15:18:26.586 # +failover-state-reconf-slaves master mymaster 192.168.126.15 6379
9125:X 12 Nov 2021 15:18:26.671 * +slave-reconf-sent slave 192.168.126.11:6379 192.168.126.11 6379 @ mymaster 192.168.126.15 6379
9125:X 12 Nov 2021 15:18:26.807 # -odown master mymaster 192.168.126.15 6379
9125:X 12 Nov 2021 15:18:27.606 * +slave-reconf-inprog slave 192.168.126.11:6379 192.168.126.11 6379 @ mymaster 192.168.126.15 6379
9125:X 12 Nov 2021 15:18:27.606 * +slave-reconf-done slave 192.168.126.11:6379 192.168.126.11 6379 @ mymaster 192.168.126.15 6379
9125:X 12 Nov 2021 15:18:27.675 # +failover-end master mymaster 192.168.126.15 6379
9125:X 12 Nov 2021 15:18:27.675 # +switch-master mymaster 192.168.126.15 6379 192.168.126.12 6379
9125:X 12 Nov 2021 15:18:27.676 * +slave slave 192.168.126.11:6379 192.168.126.11 6379 @ mymaster 192.168.126.12 6379
9125:X 12 Nov 2021 15:18:27.676 * +slave slave 192.168.126.15:6379 192.168.126.15 6379 @ mymaster 192.168.126.12 6379
9125:X 12 Nov 2021 15:18:57.724 # +sdown slave 192.168.126.15:6379 192.168.126.15 6379 @ mymaster 192.168.126.12 6379

redis-cli -p 26379 INFO Sentinel

六、项目一(cluster集群)

1.环境

  • redis的集群一般需要6个节点,3主3从。方便起见,这里所有节点在同一台服务器上模拟:
  • 以端口号进行区分:3个主节点端口号:6001/6002/6003, 对应的从节点端口号:6004/ 6005/ 6006

2.创建端口工作目录

  • 创建redis 6个端口的工作目录
cd /etc/redis/
mkdir -p redis-cluster/redis600{1..6}

#一键复制 6001~6006 脚本
vim /opt/redis.sh
#!/bin/bash
for i in {1..6}
do
cp /opt/redis-5.0.7/redis.conf /etc/redis/redis-cluster/redis600$i
cp /opt/redis-5.0.7/src/redis-cli /opt/redis-5.0.7/src/redis-server /etc/redis/redis-cluster/redis600$i
done

sh -x /opt/redis.sh

3.修改配置文件

cd /etc/redis/redis-cluster/redis6001
vim redis.conf

bind 127.0.0.1
#69行,注释掉bind项或不修改,默认监听所有网卡

protected-mode no
#88行,修改,关闭保护模式

port 6001
#92行,修改,redis监听端口,

daemonize yes
#136行,开启守护进程,以独立进程启动

cluster-enabled yes
#832行,取消注释,开启群集功能

cluster-config-file nodes-6001.conf
#840行,取消注释,群集名称文件设置

cluster-node-timeout 15000
#846行,取消注释群集超时时间设置

appendonly yes
#700行,修改,开启AOF持久化

其他5个配置文件除端口号和集群配置文件名称外改动相同
cp redis.conf ../redis6002/
cp redis.conf ../redis6003/
cp redis.conf ../redis6004/
cp redis.conf ../redis6005/
cp redis.conf ../redis6006/

cd /etc/redis/redis-cluster/
cd redis6006/												#每一个都需要改
vim redis.conf 

	#92 port 6006 #6002,6003,6004,6005,6006
	#840 cluster-config-file nodes-6006.conf #同上
  • 启动服务
  • 可以手动启动六次或者写入脚本执行脚本
#手动启动六次
cd /etc/redis/redis-cluster/redis6001
redis-server redis.conf								#启动服务

#根据对应配置文件启动redis
vim /opt/redis_start.sh
#!/bin/bash
for d in {1..6}
do
cd /etc/redis/redis-cluster/redis600$d
redis-server redis.conf
done

sh -x /opt/redis_start.sh
ps -ef | grep redis

4.加入集群

redis-cli --cluster create 127.0.0.1:6001 127.0.0.1:6002 127.0.0.1:6003 127.0.0.1:6004 127.0.0.1:6005 127.0.0.1:6006 --cluster-replicas 1

#六个实例分为三组,每组一主一从,前面的做主节点,后面的做从节点
#下面交互的时候需要输入 yes 才可以创建
#-replicas 1 表示每个主节点有一个从节点

5.测试集群

redis-cli -p 6001 -c         #加-c参数,节点之,间就可以互相跳转
127.0.0.1:6001> cluster slots    #查看节点的哈希槽编号范围
1) 1) (integer) 5461
   2) (integer) 10922        #哈希槽编号范围
   3) 1) "127.0.0.1"
      2) (integer) 6003        #主节点IP和端口号
      3) " fdca661922216dd69a63a7c9d3c4540cd6baef44"
   4) 1) "127.0.0.1"
      2) (integer) 6004        #从节点IP和端口号
     3) " a2c0c32aff0f38980accd2b63d6d952812e44740"
2) 1) (integer) 0
   2) (integer) 5460
   3) 1) "127.0.0.1"
      2) (integer) 6001
      3) "0e5873747a2e26bdc935bc76c2bafb19d0a54b11"
      4) 1) "127.0.0.1"
         2) (integer) 6006
         3) "8842ef5584a85005e135fd0ee59e5a0d67b0cf8e"
3) 1) (integer) 10923
   2) (integer) 16383
   3) 1) "127.0.0.1"
      2) (integer) 6002
      3) "81 6ddaa3d1469540b2ffbcaaf9aa867646846b30"
   4) 1) "127.0.0.1"
      2) (integer) 6005
      3) " f847077bfe6722466e96178ae8cbb09dc8b4d5eb"
  • 在6001创建数据,并查看他的槽位
127.0.0.1:6001> set name jiangjiang	
-> Redirected to slot [5798] located at 127.0.0.1:6002	//分片到6002进行存储
OK							
127.0.0.1:6002> cluster keyslot name	//查看name键的槽编号
(integer) 5798			//槽位5798 属于6002节点

相关文章