Linux集群架构——keepalived高可用集群

Linux集群概述

 根据功能划分为两大类:高可用和负载均衡  

高可用集群通常为两台服务器,一台工作,另外一台作为冗余,当提供服务的机器宕机,冗余将接替继续提供服务  

实现高可用的开源软件有:heartbeat、keepalived  

负载均衡集群,需要有一台服务器作为分发器,它负责把用户的请求分发给后端的服务器处理,在这个集群里,除了分发器外,就是给用户提供服务的服务器了,这些服务器数量至少为2  

实现负载均衡的开源软件有LVS、keepalived、haproxy、nginx,商业的有F5、Netscaler

keepalived介绍

 在这里我们使用keepalived来实现高可用集群,因为heartbeat在centos6上有一些问题,影响实验效果  

keepalived通过VRRP(Virtual Router Redundancy Protocl)来实现高可用。  

在这个协议里会将多台功能相同的路由器组成一个小组,这个小组里会有1个master角色和N(N>=1)个backup角色。  

master会通过组播的形式向各个backup发送VRRP协议的数据包,当backup收不到master发来的VRRP数据包时,就会认为master宕机了。此时就需要根据各个backup的优先级来决定谁成为新的mater。  

Keepalived要有三个模块,分别是core、check和vrrp。其中core模块为keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析,check模块负责健康检查,vrrp模块是来实现VRRP协议的。

用keepalived配置高可用

准备两台机器130和131,130作为master,131作为backup  

两台机器都执行yum install -y keepalived  

两台机器都安装nginx,其中130上已经编译安装过nginx,131上需要yum安装nginx: yum install -y nginx  

master配置:

设定vip为100  

编辑130上keepalived配置文件,>/etc/keepalived/keepalived.conf清空原配置文件。

vim /etc/keepalived/keepalived.conf

global_defs {
   notification_email {
     cc@cclinux.com
   }
   notification_email_from root@cclinux.com
   smtp_server 127.0.0.1
   smtp_connect_timeout 30
   router_id LVS_DEVEL
}

vrrp_script chk_nginx {
    script "/usr/local/sbin/check_ng.sh"
    interval 3
}

vrrp_instance VI_1 {
    state MASTER
    interface ens33
    virtual_router_id 51
    priority 100
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass cclinux>com
    }
    virtual_ipaddress {
        192.168.109.100
    }

    track_script {
        chk_nginx
    }

}

130编辑监控脚本

vim /usr/local/sbin/check_ng.sh

#!/bin/bash
#时间变量,用于记录日志
d=`date --date today +%Y%m%d_%H:%M:%S`
#计算nginx进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为0,则启动nginx,并且再次检测nginx进程数量,
#如果还为0,说明nginx无法启动,此时需要关闭keepalived
if [ $n -eq "0" ]; then
        /etc/init.d/nginx start
        n2=`ps -C nginx --no-heading|wc -l`
        if [ $n2 -eq "0"  ]; then
                echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
                systemctl stop keepalived
        fi
fi

给脚本755权限  

chomd 755 /usr/local/sbin/check_ng.sh

systemctl start  keepalived   //130启动服务

028427f7359cfc3a1e95a9eadea305b92c9.jpg

backup配置:

131上编辑配置文件

vim /etc/keepalived/keepalived.conf

global_defs {
   notification_email {
     cc@cclinux.com
   }
   notification_email_from root@cclinux.com
   smtp_server 127.0.0.1
   smtp_connect_timeout 30
   router_id LVS_DEVEL
}

vrrp_script chk_nginx {
    script "/usr/local/sbin/check_ng.sh"
    interval 3
}

vrrp_instance VI_1 {
    state BACKUP
    interface ens33
    virtual_router_id 51
    priority 90
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass cclinux>com
    }
    virtual_ipaddress {
        192.168.109.100
    }

    track_script {
        chk_nginx
    }

}

131上编辑监控脚本

 vim /usr/local/sbin/check_ng.sh

#时间变量,用于记录日志
d=`date --date today +%Y%m%d_%H:%M:%S`
#计算nginx进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为0,则启动nginx,并且再次检测nginx进程数量,
#如果还为0,说明nginx无法启动,此时需要关闭keepalived
if [ $n -eq "0" ]; then
        systemctl start nginx
        n2=`ps -C nginx --no-heading|wc -l`
        if [ $n2 -eq "0"  ]; then
                echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
                systemctl stop keepalived
        fi
fi

 给脚本755权限  

chmod 755 /usr/local/sbin/check_ng.sh

systemctl start keepalived  //131上也启动服务

9db6aef84226528fd502a184f4b2a8eb966.jpg

检查:

master,我们停止nginx后,nginx又重启了如下图所示,说明keepalived配置成功了

8584c27c3c1e6c56c4085d2de69087e90e9.jpg

backup一样的:

6a81f0f3fedba925c0f2d7c18520e9a7cd1.jpg

浏览器测试:

c595dc7d4a5ee2a1f4c79715abf6bb97898.jpg

48c4c4f14f6d3240baccbde501ca9084f25.jpg

f418c24dbdacd52f9dff3d562dfa87efb62.jpg

由上面可知,我们的vip100设定成功,绑定在master上面的!

538bf89017688718f93a13a33a7ab769a8c.jpg

实例1测试:

在master上增加iptabls规则  

iptables -I OUTPUT -p vrrp -j DROP

f7a92de4660f7bf2134e159f2bfa8d537a9.jpg

1a429dbc561a08da88497d887679b5523f7.jpg

由上面所示,虽然从上也有100,但是vip依然在master上面,所以这样是不行的。

实例2测试:

停掉master的keepalived服务

25e075fe52d5bb815e3192364c453dcdea0.jpg

我们可以看到,vip立马切换到131服务器上面了。

但是我们马重启130的keepalived,vip会立马回到我们的130机器上:

454b8214d004e3f426ce0c6a9266d58ee2a.jpg

日志立马也会显示出来:

b30dcdac29c7e00a761e832198a3a3a9917.jpg

 

转载于:https://my.oschina.net/ccLlinux/blog/1975936