《Redis设计与实现》笔记
Sentinel是Redis的高可用性解决方案:由一个或多个Sentinel实例组成的Sentinel系统可以监视任意多个主服务器,以及这些主服务器属下的所有从服务器,并在被监视的主服务器进入下线状态时,自动将下线主服务器属下的某个从服务器升级为新的主服务器。
一、Sentinel的启动
当一个Sentinel启动时,它将执行以下步骤:
1)初始化服务器
因为Sentinel本质上是一个运行在特殊模式下的Redis服务器,所以启动Sentinel的第一步是初始化一个普通的Redis服务器。Sentinel并不使用数据库,所以启动时载入RDB或AOF文件。
2)将普通Redis服务器使用的代码替换成Sentinel专用代码
3)初始化Sentinel状态
4)根据给定的配置文件,初始化Sentinel的监视主服务器列表
5}创建连向主服务器的网络连接·
初始化Sentinel的最后一步是创建连向被监视主服务器的网络连接,Sentinel将成为主服务器的客户端,Sentinel会创建两个连向主服务器的异步网络连接,一个是命令连接,这个连接专门用于向主服务器发送命令,并接受命令回复;另一个是订阅连接,这个连接专门用于订阅主服务器的_sentinel_:hello频道。
二、获取主服务器信息
Sentinel默认以10秒一次的频率,通过命令连接向被监视的主服务器发送INFO命令,并通过分析INFO命令的回复来获取主服务器的当前信息。
通过分析INFO命令的回复信息,Sentinel可以获取以下两方面的信息:
一方面是关于主服务器本身的信息,包括run_id域记录的服务器运行ID,以及role域记录的服务器角色。根据这些信息,Sentinel将对主服务器实例结构进行更新。
另一方面是关于主服务器属下所有从服务器的信息。这些信息会被用于更新主服务器实例结构的salves字典。
三、获取从服务器信息
当Sentinel发现新的从服务器出现时,Sentinel还会创建对这个从服务器的命令连接和订阅连接。在创建命令连接之后,Sentinel在默认情况下,会以10秒一次的频率,向从服务器发送INFO命令,并获得回复。根据这些回复,Sentinel会对从服务器的实例结构进行更新。
四、向主服务器和从服务器发送信息
在默认情况下,Sentinel通过命令连接会以每两秒一次的频率向所有被监视的主服务器和从服务器发送以下格式的命令:
PUBLISH_sentinel_:hello "<s_ip>,<s_port>,<s_runid>,<s_epoch>,<m_name>,<m_ip>,<m_port>,<m_epoch>"
五、接受来自主服务器和从服务器的频道消息
当Sentinel与一个主服务器或从服务器建立起订阅连接后,Sentinel就会对订阅连接,向服务器发送订阅命令:SUBSCRIBE_sentinel_:hello
对于每个与Sentinel连接的服务器,Sentinel既通过命令连接向服务器的_sentinel_:hello频道发送消息,又要通过订阅连接从服务器的_sentinel_:hello频道接受消息。
对于监视同一个服务器的多个Sentinel来说,一个Sentinel发送的信息会被其他Sentinel接受到,这些信息会被用于更新其他Sentinel对发送信息的Sentinel的认知,也会被用于更新其他Sentinel对被监视服务器的认知。当Sentinel通过频道信息发现一个新的Sentinel时,它不仅会为新的Sentinel在Sentinels字典中创建对应的实例结构,还会创建一个连向新Sentinel的命令连接,而新Sentinel也同样会创建连向这个Sentinel的命令连接,最终监视同一个主服务器的多个Sentinel将形成相互连接的网络。
六、检测主观下线状态
在默认情况下,Sentinel会以每秒一次的频率向所有与它创建了命令连接的实例(包括主从服务器和Sentinel)发送PING命令,并通过实例返回的PING命令回复来判断实例是否在线。
Sentinel配置文件中的down-after-milliseconds选项指定了Sentinel判断实例进入主观下线所需的时间长度:如果一个实例在down-after-milliseconds毫秒内,连续向Sentinel返回无效回复,那么Sentinel在对应的实例结构中的flags属性打开SRI_S_DOWN标识,以此表明这个实例进入主观下线状态。
七、检查客观下线状态
当Sentinel将一个主服务器判断为主观下线后,为了确认这个主服务器是否真的下线了,它会同样监视这个一主服务器的其他Sentinel进行询问,如果判断为主观下线的数量到达一定数量后(Sentinel配置中设置的quorum的值),将这个服务器判断为客观下线,并进行故障转移操作。
八、选举领头Sentinel
当一个主服务器判断为客观下线时,监视这个下线主服务器的各个Sentinel会进行协商,选举出一个领头Sentinel,并由领头Sentinel对下线主服务器执行故障转移操作。
选举规则:
- Sentinel设置局部领头Sentinel的规则是先到先得:最先向目标Sentinel发送设置要求的源Sentinel将成为目标Sentinel的局部领头Sentinel,而之后接收到的所有设置要求都会被目标Sentinel拒绝。
- 如果某个Sentinel被半数以上的Sentinel设置成了局部领头Sentinel,那么这个Sentinel成为领头Sentinel。
- 如果在给定时限内,没有选出结果,将在一定时间后再次选举,直到选出领头Sentinel为止。并且每次选举后所有Sentinel配置纪元自增一。
九、故障转移
在选举出领头Sentinel后,领头Sentinel对已下线的主服务器执行故障转移操作,包含以下三个步骤:
1)在已下线的主服务器属下的所有从服务器中,选出一个从服务器,并将其转换成主服务器。
领头Sentinel会将已下线主服务器的所有从服务器保存到一个列表里面,然后筛选出新的主服务器:
1.删除列表中所有处于下线或者断线状态的从服务器
2.删除列表中所有最近五秒内没有回复过领头Sentinel的INFO命令的从服务器(当主服务器处于下线时或Sentinel正在进行故障转移操作时,Sentinel对从服务器发送INFO命令的频率从十秒变为一秒一次)
3.删除所有与下线主服务器连接断开超过down-after-milliseconds*10毫秒的从服务器。
最后选出优先级最高、复制偏移量最大的从服务器。
2)让已下线主服务器属下的所有从服务器改为复制新的主服务器。
3) 将这个下线的主服务器改为新的主服务器的从服务器,当这个下线的主服务器重新上线时,它将成为新的主服务器的从服务器。
转载:https://blog.csdn.net/weixin_45003125/article/details/105219581