在主从模式下宕机要区分来看:
一、slave的redis宕机:在Redis中从redis库重新启动后会自动加入到主从架构中,自动完成同步数据;如果从数据库实现了持久化,只要重新加入到主从架构中会实现增量同步。
二、Master的redis宕机:假如主从都没数据持久化,此时千万不要立马重启服务,否则可能会造成数据丢失。
正确的操作如下:
1. 在slave数据上执行SLAVEOF ON ONE,会自动来断开主从关系并把slave升级为主库
2. 此时重新启动主数据库,执行SLAVEOF,把自动它设置为从库,自动备份数据。
以上过程很容易配置错误,可以使用简单的方法:redis的哨兵(sentinel)的功能:
Redis提供了sentinel(哨兵)机制通过sentinel模式启动redis后,自动监控master/slave的运行状态,基本原理是:心跳机制+投票裁决。
每个sentinel会向其它sentinal、master、slave定时发送消息,以确认对方是否“活”着,如果发现对方在指定时间(可配置)内未回应,则暂时认为对方已挂(所谓的“主观认为宕机” Subjective Down,简称SDOWN)。
若"哨兵群"中的多数sentinel,都报告某一master没响应,系统才认为该master"彻底死亡"(即:客观上的真正down机,Objective Down,简称ODOWN),通过一定的vote算法,从剩下的slave节点中,选一台提升为master,然后自动修改相关配置。