双机热备技术

双机热备技术

一、双机热备概述

防火墙一般用作内网到外网的出口,是业务关键路径上的设备。为了防止因一台设备故障而导致的业务中断,要求防火墙必须提供更高的可靠性,此时需要使用防火墙双机热备组网——当一台防火墙出现故障时,业务流量能平滑地切换到备份防火墙上,保证流量不中断,使内外网用户交互时完全感知不到曾经出现过网络故障。
在这里插入图片描述

二、双机热备基本原理

1、双机热备协议架构

在这里插入图片描述

(1)VRRP

<1>作用

① 负责单个接口的故障检测和流量引导。每个VRRP备份组拥有一个 虚拟IP地址 ,作为网络的网关地址;
②在VRRP主备倒换时通过发送免费ARP来刷新对接设备的MAC转发表来引导流量。

<2>. VRRP报文

① VRRP报文用来将主用设备的优先级和状态通告给备用设备。
② VRRP报文承载在IP报文之上,为组播报文(组播地址为224.0.0.18),协议号为112。
③Priority:
主用设备在备份组中的优先级。
Priority是决定双机中哪台设备为主用设备的关键。
0-255 ,默认是100 越打越优先:如果优先级一致,比IP地址,越大越优先

<3>. VRRP 状态机

加入VRRP备份组的接口有三种状态(Initialize状态、Standby状态、Active状态),只有处于主用状态的设备才可响应ARP请求,转发业务报文。并且发送VRRP报文,主动联系备用设备。

<4>.VRRP状态切换

①链路正常时:
•虚拟IP地址在状态为Active的设备接口上生效。
•PC请求网关地址的ARP时,只有状态为Active的设备会应答ARP。
•业务流量被引导到状态为Active的设备接口上进行转发。
在这里插入图片描述

②当Active设备出现接口、链路或整机故障时:
·Standby设备接口上的VRRP备份组状态将切换到Active ,发送免费ARP。
·交换机上的MAC表刷新,出接口指向备用设备。
·PC发出的业务流量被引导到备用设备接口上进行转发。

<5>.VRRP的不足

当防火墙上下行业务端口上都配置了VRRP备份组时,这两个VRRP备份组是独立运行的,可能出现上下行两个VRRP备份组状态不一致的情况。
在这里插入图片描述

(2)VGMP

将系统中所有的VRRP备份组集中管理,控制状态统一切换,保证出现故障时上下行流量能同步切换到备用防火墙。

<1>VGMP 报文

① VRRP封装:此时VGMP报文也是组播报文。这是最初的VGMP报文封装格式。
②UDP封装:此时VGMP报文是单播报文。在原有的IP报文头之上增加了UDP头和VGMP扩展头,VGMP报文内部的格式没有变化。

<2>VGMP 状态机

VGMP管理组的主备状态决定了双机热备组网中防火墙设备的主备状态,因此VGMP管理组的状态也可以看做是防火墙设备的状态。

<3>VGMP状态切换

①因接口或链路故障引起的切换;
②因整机或心跳链路故障引起的切换;
③抢占流程:故障恢复后的切换流程。

<4>故障检测方式

①检测VRRP备份组状态 :用于防火墙业务接口为三层接口,业务接口连接二层交换机场景。
②直接检测单个物理接口状态:由于三层设备无法处理VRRP组播报文,所以当防火墙业务接口为三层接口,业务接口连接三层设备(路由器)时使用此方式。
③检测透明模式下VLAN接口状态:由于防火墙业务接口为二层接口,无法配置VRRP,所以采用此方式。
④检测IP-LINK逻辑链路的状态:用于检测非直连链路的可达性。
⑤检测BFD逻辑链路的状态:用于检测非直连链路的可达性。

<5>流量引导手段

①虚拟IP地址方式:用于防火墙三层业务接口连接二层交换机组网。
②路由COST调整方式:用于防火墙三层业务接口连接路由器,主备备份组网。
③动态路由收敛方式:用于防火墙三层业务接口连接路由器,路由器组网,负载分担组网。
④VLAN启用和禁用方式:用于防火墙业务接口工作在透明模式的组网中。

(3)HRP

负责双机之间的数据同步。

<1>HRP报文封装方式

①VRRP封装
②UDP封装

<2> HRP数据备份范围

能够备份配置命令:只能在主用设备上配置,备用设备不能配置。
①可以备份的主用设备状态:
在这里插入图片描述

<3> HRP数据备份方式

在这里插入图片描述

<4>备份通道状态

① running:正常运行。
② ready:正常运行。此接口为备用备份通道,当前未使用。
③ peerdown:本端正常,但是收不到对端的心跳报文。
④ invalid:未指定心跳口的IP地址,心跳口工作在二层。
⑤ down:心跳接口的物理状态与协议状态均为Down。

5、主备备份和负载分担

(1)主备备份和负载分担

①主备备份:指正常情况下仅由主用设备处理业务,备用设备空闲;当主用设备接口、链路或整机故障时,备用设备切换为主用设备,接替主用设备处理业务。
②负载分担:也可以称为“互为主备”,即两台设备同时处理业务。当其中一台设备发生故障时,另外一台设备会立即承担其业务,保证原来需要通过这台设备转发的业务不中断。

在这里插入图片描述
在这里插入图片描述

三、双机热备故障解决

1.未建立主备状态

(1)可能原因

①未启用HRP功能
②未指定心跳口
③未指定监控对象

(2)建议

检查配置

2.双机热备工作于active/active状态

(1)故障现象

两台防火墙的命令行提示符都有HRP_M前缀。使用display hrp state命令查看双机热备状态,两台防火墙都显示为Active。

(2)可能原因

在这里插入图片描述

(3)建议

检查配置,查看日志.

3. VRRP成员接口状态异常

(1)故障现象

①现象1:VRRP成员接口状态为Initialize。
②现象2:同一VRRP备份组内,两台防火墙上相对应的接口状态均为Active。
③ 现象3:VRRP成员接口的附加状态为peerdown。

(2)可能原因

在这里插入图片描述

(3)建议

检查配置,查看日志

4.双机热备配置完成后,业务不通

(1)故障现象

①现象1:部分业务不通,或者全部业务不通。
②现象2:部分业务速度慢,或者时断时续

(2)可能原因

在这里插入图片描述

(3)建议

检查配置,查看日志

5.主用链路故障后不切换主备状态,导致业务中断

(1)故障现象

防火墙接口或者链路故障,但是未切换主备状态。相关接口上的业务全部中断。

(2)可能原因

①主用防火墙上Active VGMP管理组的优先级降低后,仍然高于备用防火墙上Standby VGMP管理组的优先级。通常是因为备用防火墙上有相同数量的接口故障或者链路故障。
②主用防火墙上Active VGMP管理组的优先级未降低,即故障的接口或链路并没有被VGMP管理组监控。

(3)建议

检查VGMP管理组的优先级

6.主备切换后,业务中断

(1)故障现象

①现象1:部分业务中断或者全部业务中断。
②现象2:部分业务速度慢,或者时断时续。

(2)可能原因

在这里插入图片描述

(3)建议

检查VGMP管理组的优先级


版权声明:本文为m0_51864710原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。