热线:400-829-9580

当前位置:首页 > 系统集成 > BIGIP 高可用性配置


1 BIGIP V9系列的带外管理


1.1 BIGIP的硬件体系结构

在BIGIP V9系列中,所有的产品均采用了独立的管理CPU支持带外管理。

 

下面是BIGIP V9系列硬件的体系结构:

 

 


 

 

如图:在整个BIGIP硬件结构中,分为三个大的部分。

 

Switch Board:主要负责完成硬件级的二到四层交换加速功能,并且提供BIGIP对外的所有业务流量端口。在Switch Board上,还提供了一个管理用以太网接口和一个Console端口。

 

HOST:      HOST的硬件设备以核心CPU为主。其上运行有两个操作系统,一个是Host OS,主要负责系统管理功能如WEB管理界面、健康检查、SNMP、进程监控等。HOST可以配置一个IP地址,该IP地址在BIGIP管理界面中在Platform->Management IP Address处配置,或者在命令行下通过config命令配置。另外一个是TMM Micro Kernel,TMM Micro Kernel主要负责所有的四-七层交换的业务流量,并控制Switch Board上的所有资源。TMM在启动后,将接管所有的CPU资源和主要的内存资源。所有和应用流量控制相关的IP、VLAN、VS、route、Pool等均配置在TMM Kernel中。TMM通过信令系统与Host OS 通讯。

 

SCCP:      SCCP为一个独立的系统,具备自己的独立的OS、Memory和Flash Disk。在电源接通并打开电源开关的情况下,SCCP即已经启动,并且不受HOST系统重起、挂起等影响。SCCP在正常工作时,运行在Bridge模式下,将所有管理以太网口和Console的连接传递给HOST系统,以对HOST直接进行管理。同时,也可以给SCCP配置自己的独立IP地址和路由。SCCP在配置IP地址后,仅对外提供SSH服务。在重起SCCP的时候,整个系统,包括HOST均会被重新启动。

1.2 带外管理配置

在配置带外管理的时候,需要配置两个管理地址,一个是Management IP Address主要用于Host,对外提供WEB/SSH方式管理。另外一个是SCCP地址,对外提供SSH服务。通常情况下,建议通过Management IP Address进行设备管理。在出现紧急情况时,可通过SSH方式访问SCCP,然后通过SCCP进入Console或者重新启动设备。

 

 

l SCCP地址配置方式:

 

首先,通过正常方式SSH/Console获得Host的命令行界面。在命令行中输入:

#ssh sccp

 

进入SCCP之后,执行命令:

sccp#netconfig

然后输入IP地址、Mask和Default Route即可,其他的项目可以不用输入。配置结束后。需要在sccp命令行下执行reboot使配置生效:

sccp#reboot

 

访问SCCP只能通过管理口ssh2进行连接。

 

l 如何从SCCP进入Console:

 

在SCCP命令行中执行命令:

sccp#hostconsh

即可进入console界面。

 

如何从SCCP进入Host:

在SCCP命令行中执行命令:

sccp#ssh host

即可进入Host的命令行界面。

2 BIGIP V9冗余切换原理


2.1 BIGIP冗余切换方式

2.1.1 串口心跳线方式

两台BIGIP之间通过Failover端口方式相连。切换触发信号通过串口线通知对端设备,同时,每台BIGIP通过串口心跳线监控对端设备的状态。


在串口心跳线的结构时,切换流程如下:

 

l Active 设备负责在心跳线上产生一个高电平

l Backup设备监听对端的高电平

l 当Backup设备监听到对端没有高电平时,将自己转换为Active设备

l Backup设备对外发送ARP广播,将所有的VS和浮动IP对外广播,表明这些地址在自己这端,引发网络流量切换。

 

在BIGIP的串口心跳线中,主要通过电平方式来通知对端和监控对端状态,在串口心跳线中没有任何的数据信号传输。

2.1.2 网络心跳方式

由于串口线的长度有限(15M),当两台BIGIP物理位置相距较远的时候。两台BIGIP之间还可以通过网络线连接来实现心跳信号的传递。切换触发信号通过网络通知对端设备,同时,每台BIGIP通过网络连线来监控对端设备的状态。


 

两台BIGIP之间通过TCP Port 1028进行心跳信号传递。切换的过程如下:

 

l Acitve设备负责产生心跳信号

l Backup设备监听Active设备的心跳信号

l 当Backup设备在一定时间内没有接收到心跳信号时,则将自己切换为Active

l Backup设备对外发送ARP广播,将所有的VS和浮动IP对外广播,表明这些地址在自己这端,引发网络流量切换。

 

在配置Network FailSafe的时候,将指定一个VLAN来进行心跳信号传输。这个VLAN通常为两台BIGIP之间的一个独立连接VLAN或者Internal VLAN。

2.1.3 BIGIP冗余切换的其他特性

l 关于Active/Backup状态

在默认配置下,两台BIGIP在切换完成后,当Active设备恢复后,不会再次发生切换。而保持原Backup设备的Active状态。但在需要时,也可以通过配置来手工指定某台设备的优先状态为Active或Backup。


在手工设置后,当指定的Active设备恢复后,将自动接管流量。

 

l 关于切换时的动作

在通常情况下,可以选择BIGIP在故障切换时的Active设备动作。这些动作有以下几种:

Ø Failover:仅发生切换,没有其他的动作

Ø Restart All:先发生切换,然后重起本机所有的进程

Ø Reboot:先发生切换,然后重起整台设备

Ø Restart Service:不切换,仅重起故障进程

 

根据不同的情况要求,可以针对特定的环境和触发条件选取不同的切换动作。

 

2.2 BIGIP冗余切换的触发条件

2.2.1 VLAN FailSafe

在设置VLAN FailSafe时,BIGIP将监控每一个配置了VLAN FailSafe的VLAN流量。


 

切换流程如下:

l Acitve设备发现指定的VLAN没有流量

l 等待配置Fail-Safe Timeout一半的时间

l 试图产生网络流量

l 启动切换流程

l Backup设备监听Active设备的网络信号

l 当Backup设备在设定时间内没有接收到Active设备信号时,将自己转换为Active

l Backup设备对外发送ARP广播,将所有的VS和浮动IP对外广播,表明这些地址在自己这端,引发网络流量切换。

 

VLAN FailSafe切换时,可选择Reboot,Failover和Restart All三种方式,通常情况下选择Failover方式,切换到备份设备。

2.2.2 GateWay FailSafe

在设置GateWay FailSafe时,BIGIP将监控GateWay Pool中的每一个节点。


 

在配制时可选配Gateway Pool中少于多少个健康节点时发生切换。

2.2.3 硬件监控

BIGIP对自身的硬件板卡和关键部件进行监控,在关键部件发生故障时,也会触发BIGIP切换。


 

在BIGIP硬件平台上,采用了专门的硬件监控系统来检测整体的硬件运行状态,如CPU,内存等关键部件的运行情况。

2.2.4 主要进程监控

BIGIP对自身的关键进程进行监控,当关键进程出现故障无法响应或者无法启动时,将会触发BIGIP切换。


 

在BIGIP设计中,一些重要的进程均被处于严格的监控中。监控系统一旦发现到这些重要进程产生异常情况。则可以通过预先设置的动作对当时的情况进行处理。这些处理方式包括:切换到备份BIGIP,重起故障BIGIP,重新启动异常进程,不做处理等。