IRF(Intelligent Resilient Framework,智能弹性架构)是H3C自主研发的软件虚拟化技术。它的核心思想是将多台设备通过IRF物理端口连接在一起,进行必要的配置后,虚拟化成一台“分布式设备”。使用这种虚拟化技术可以实现多台设备的协同工作、统一管理和不间断维护。
为了便于描述,这个“虚拟设备”也称为IRF。所以,本文中的IRF有两层意思,一个是指IRF技术,一个是指IRF设备。
IRF主要具有以下优点:
·
简化管理。IRF形成之后,用户通过任意成员设备的任意端口都可以登录IRF系统,对IRF内所有成员设备进行统一管理。
·
高可靠性。IRF的高可靠性体现在多个方面,例如:IRF由多台成员设备组成,Master设备负责IRF的运行、管理和维护,Slave设备在作为备份的同时也可以处理业务。一旦Master设备故障,系统会迅速自动选举新的Master,以保证业务不中断,从而实现了设备的1:N备份;此外,成员设备之间的IRF链路支持聚合功能,IRF和上、下层设备之间的物理链路也支持聚合功能,多条链路之间可以互为备份也可以进行负载分担,从而进一步提高了IRF的可靠性。
·
强大的网络扩展能力。通过增加成员设备,可以轻松自如的扩展IRF的端口数、带宽。因为各成员设备都有CPU,能够独立处理协议报文、进行报文转发,所以IRF还能够轻松自如的扩展处理能力。
如
图1-1
所示,Master和Slave组成IRF,对上、下层设备来说,它们就是一台设备——IRF。
图1-1 IRF
组网应用示意图
IRF虚拟化技术涉及如下基本概念:
1. 角色
IRF中每台设备都称为成员设备。成员设备按照功能不同,分为两种角色:
·
Master:负责管理整个IRF。
·
Slave:作为Master的备份设备运行。当Master故障时,系统会自动从Slave中选举一个新的Master接替原Master工作。
Master和Slave均由角色选举产生。一个IRF中同时只能存在一台Master,其它成员设备都是Slave。关于设备角色选举过程的详细介绍请参见
1.3.3
角色选举
。
2. IRF端口
一种专用于IRF的逻辑接口,分为IRF-Port1和IRF-Port2。它需要和物理端口绑定之后才能生效。
3. IRF物理端口
设备上可以用于IRF连接的物理端口。IRF物理端口可以是以太网接口或者光口。
通常情况下,以太网接口或者光口负责向网络中转发业务报文,当它们与IRF端口绑定后就作为IRF物理端口,用于成员设备之间转发报文。可转发的报文包括IRF相关协商报文以及需要跨成员设备转发的业务报文。
4. IRF合并
如
图1-2
所示,两个IRF各自已经稳定运行,通过物理连接和必要的配置,形成一个IRF,这个过程称为IRF合并(merge)。
图1-2 IRF
合并示意图
5. IRF分裂
如
图1-3
所示,一个IRF形成后,由于IRF链路故障,导致IRF中两相邻成员设备物理上不连通,一个IRF变成两个IRF,这个过程称为IRF分裂(split)。
图1-3 IRF
分裂示意图
6. 成员优先级
成员优先级是成员设备的一个属性,主要用于角色选举过程中确定成员设备的角色。优先级越高当选为Master的可能性越大。
设备的缺省优先级均为1,如果想让某台设备当选为Master,则在组建IRF前,可以通过命令行手工提高该设备的成员优先级。
IRF系统将经历
物理连接
、
拓扑收集
、
角色选举
、
IRF的管理与维护
四个阶段。成员设备之间需要先建立IRF物理连接,然后会自动进行拓扑收集和角色选举,完成IRF的建立,此后进入IRF管理和维护阶段。
1. 连接介质
要形成一个IRF,需要先连接成员设备的IRF物理端口。建议用户使用SFP堆叠电缆(SFP-STACK-Kit)在多台S5120-SI系列交换机之间进行IRF连接。
2. 连接要求
本设备上与IRF-Port1绑定的IRF物理端口只能和邻居成员设备IRF-Port2口上绑定的IRF物理端口相连,本设备上与IRF-Port2口绑定的IRF物理端口只能和邻居成员设备IRF-Port1口上绑定的IRF物理端口相连,如
图1-4
所示。否则,不能形成IRF。
图1-4 IRF
物理连接示意图
3. 连接拓扑
IRF的连接拓扑有两种:链形连接和环形连接,如
图1-5
所示。
·
相比环形连接,链形连接对成员设备的物理位置要求更低,主要用于成员设备物理位置分散的组网。
·
环形连接比链形连接更可靠。因为当链形连接中出现链路故障时,会引起IRF分裂;而环形连接中某条链路故障时,会形成链形连接,IRF的业务不会受到影响。
图1-5 IRF
连接拓扑示意图
每个成员设备和邻居成员设备通过交互IRF Hello报文来收集整个IRF的拓扑。IRF Hello报文会携带拓扑信息,具体包括IRF端口连接关系、成员设备编号、成员设备优先级、成员设备的桥MAC等内容。
每个成员设备在本地记录自己已知的拓扑信息。设备刚启动时只记录了自身的拓扑信息。当IRF端口状态变为up后,设备会将已知的拓扑信息周期性的从up状态的IRF端口发送出去;直接邻居收到该信息后,会更新本地记录的拓扑信息;如此往复,经过一段时间的收集,所有成员设备都会收集到完整的拓扑信息(称为拓扑收敛)。
此时会进入角色选举阶段。
确定成员设备角色为Master或Slave的过程称为角色选举。
角色选举会在拓扑变更的情况下产生,比如IRF建立、新设备加入、Master设备离开或者故障、两个IRF合并等。角色选举规则如下:
(1) 当前Master优先(IRF系统形成时,没有Master设备,所有加入的设备都认为自己是Master,会跳转到第二条规则继续比较);
(2) 成员优先级大的优先;
(3) 系统运行时间长的优先(各设备的系统运行时间信息也是通过IRF Hello报文来传递的);
(4) 桥MAC地址小的优先。
从第一条开始判断,如果判断的结果是多个最优,则继续判断下一条,直到找到唯一最优的成员设备才停止比较。此最优成员设备即为Master,其它成员设备则均为Slave。
在角色选举完成后,IRF形成,进入IRF管理与维护阶段。
·
IRF合并的情况下,两个IRF会进行IRF竞选,竞选仍然遵循角色选举的规则,竞选失败方的所有成员设备将自动重启后均以Slave的角色加入获胜方,最终合并为一个IRF。
·
不管设备与其它设备一起形成IRF,还是加入已有IRF,如果该设备被当选为Slave,则该设备会使用Master的配置重新初始化和启动,以保证和Master上的配置一致,而不管该设备在重新初始化之前有哪些配置、是否保存了当前配置。
角色选举完成之后,IRF形成,所有的成员设备组成一台虚拟设备存在于网络中,所有成员设备上的资源归该虚拟设备拥有并由Master统一管理。
1. 成员编号
在运行过程中,IRF系统使用成员编号(Member ID)来标志和管理成员设备,并在端口编号和文件系统中引入成员编号的标识信息。该编号关系到整个IRF的管理和运行,因此,需要用户在设备加入IRF前统一规划、配置设备的成员编号,以保证IRF中成员编号的唯一性。
2. 端口命名规则
对于单独运行的设备(即没有加入任何IRF),端口编号采用设备编号/子槽位编号/端口序号的格式,其中:
·
缺省情况下,设备编号为1。
·
如果设备曾经加入过IRF,则在退出IRF后,仍然会使用在IRF中时的成员编号作为自身的设备编号。
·
子槽位编号:接口卡所在槽位的编号。对于S5120-SI系列交换机,前面板上所有端口的子槽位编号均为0。
·
端口序号与各型号交换机支持的端口数量相关,请查看设备面板上的丝印。
比如,要将单独运行的设备Sysname的端口GigabitEthernet1/0/1的链路类型设置为Trunk,可参照以下步骤:
<Sysname> system-view
[Sysname] interface gigabitethernet 1/0/1
[Sysname-GigabitEthernet1/0/1] port link-type trunk
对于IRF中的成员设备,端口编号仍然采用成员设备编号/子槽位编号/端口序号的格式,其中:
·
成员设备编号用来标志不同成员设备上的端口。
·
子槽位编号和端口序号的含义和取值与单独运行时的一样。
比如,要将IRF中的成员设备Slave3(成员编号为3)子槽位0上第一个端口的链路类型设置为Trunk,可参照以下步骤:
<Sysname> system-view
[Sysname] interface gigabitethernet 3/0/1
[Sysname-GigabitEthernet3/0/1] port link-type trunk
3. 文件系统命名规则
对于单独运行的设备,直接使用存储介质的名称就可以访问设备的文件系统了(存储介质的命名请参见“基础配置指导”中的“文件系统管理配置”)。
对于IRF中的成员设备,直接使用存储介质的名称可以访问Master设备的文件系统,使用“slot
Member-ID
#
存储介质的名称
”才可以访问Slave设备的文件系统。
(1) 创建并访问IRF中Master设备存储介质Flash根目录下的test文件夹,可参照以下步骤:
<Master> mkdir test
%Created dir flash:/test.
<Master> dir
Directory of flash:/
0 -rw- 10105088 Apr 26 2000 13:44:57 test.bin
1 -rw- 2445 Apr 26 2000 15:18:19 config.cfg
2 drw- - Jul 14 2008 15:20:35 test
97920 KB total (88020 KB free)
(2) 创建并访问IRF中Slave设备(成员编号为3)存储介质Flash根目录下的test文件夹,可参照以下步骤:
<Master> mkdir slot3#flash:/test
%Created dir slot3#flash:/test.
<Master> cd slot3#flash:/test
<Master> pwd
slot3#flash:/test
<Master> cd slot3#flash:/
<Master> mkdir test
%Created dir slot3#flash:/test.
(3) 将Master的test.bin文件拷贝到Slave3 Flash的根目录下,可参照以下步骤:
<Master> pwd
slot3#flash:
//
以上显示信息表明,当前的工作路径是Slave3 Flash
的根目录
<Master> cd flash:/
<Master> pwd
flash:
//
以上操作表明,当前的工作路径已经回到了Master Flash
的根目录
<Master> copy test.bin slot3#flash:/
Copy flash:/test.bin to slot3#flash:/test.bin?[Y/N]:y
%Copy file flash:/test.bin to slot3#flash:/test.bin...Done.
4. 配置文件应用规则
(1) 配置文件的同步
IRF技术使用了严格的配置文件同步机制,来保证IRF中的多台设备能够像一台设备一样在网络中工作,并且在Master设备出现故障之后,其余设备仍能够正常执行各项功能。
·
IRF中的Slave设备在启动时,会自动寻找Master设备,并将Master设备的当前配置文件同步到本地并执行;如果IRF中的所有设备同时启动,则Slave设备会将Master设备的起始配置文件同步至本地并执行。
·
在IRF正常工作后,用户所进行的任何配置,都会记录到Master设备的当前配置文件中,并同步到IRF中的各个设备;用户在执行
save
命令将Master设备的当前配置文件保存为起始配置文件时,其它Slave设备均同步进行保存工作,以便使IRF中所有设备的起始配置文件保持统一。
通过即时的同步,IRF中所有设备均保存有相同的配置文件,即使Master设备出现故障,其它设备仍能够按照相同的配置文件执行各项功能。
(2) 配置文件的应用
设备的配置文件内容分为两部分:全局配置和端口配置,IRF中的Slave设备在应用Master设备上的这两种配置时,会采取不同的方式。
·
全局配置:所有的Slave设备都严格执行Master设备当前的全局配置,即IRF中所有成员设备所应用的全局配置都是相同的。
·
端口配置:Slave设备在应用Master设备上的端口配置时,只关注指定自身端口的配置(例如,编号为3的Slave设备只关注Master设备上是否具有GigabitEthernet3/0/x端口的配置)。如果Master设备上存在有自身端口的配置,则应用该配置;如果没有,则无论Slave设备在加入IRF前在自身端口下存在任何配置,均只以空配置方式工作。
5. IRF拓扑维护
如果某成员设备A down或者IRF链路down,其邻居设备会立即将“成员设备A离开”的信息广播通知给IRF中的其它设备。获取到离开消息的成员设备会根据本地维护的IRF拓扑信息表来判断离开的是Master还是Slave,如果离开的是Master,则触发新的角色选举,再更新本地的IRF拓扑;如果离开的是Slave,则直接更新本地的IRF拓扑,以保证IRF拓扑能迅速收敛。
IRF链路故障会导致一个IRF变成两个新的IRF。这两个IRF拥有相同的IP地址等三层配置,会引起地址冲突,导致故障在网络中扩大。为了提高系统的可用性,当IRF分裂时我们就需要一种机制,能够检测出网络中同时存在多个IRF,并进行相应的处理尽量降低IRF分裂对业务的影响。MAD(Multi-Active Detection,多Active检测)就是这样一种检测和处理机制。它主要提供以下功能:
·
分裂检测:通过LACP(Link Aggregation Control Protocol,链路聚合控制协议)或者免费ARP(Gratuitous Address Resolution Protocol)来检测网络中是否存在多个IRF;
·
冲突处理:IRF分裂后,通过分裂检测机制IRF会检测到网络中存在其它处于Active状态(表示IRF处于正常工作状态)的IRF。冲突处理会让Master成员编号最小的IRF继续正常工作(维持Active状态),其它IRF会迁移到Recovery状态(表示IRF处于禁用状态),并关闭Recovery状态IRF中所有成员设备上除保留端口以外的其它所有物理端口(通常为业务接口),以保证该IRF不能再转发业务报文;
·
MAD故障恢复:IRF链路故障导致IRF分裂,从而引起多Active冲突。因此修复故障的IRF链路,让冲突的IRF重新合并为一个IRF,就能恢复MAD故障。如果在MAD故障恢复前,处于Recovery状态的IRF也出现了故障,则需要将故障IRF和故障链路都修复后,才能让冲突的IRF重新合并为一个IRF,恢复MAD故障;如果在MAD故障恢复前,故障的是Active状态的IRF,则可以通过命令行先启用Recovery状态的IRF,让它接替原IRF工作,以便保证业务尽量少受影响,再恢复MAD故障。
·
IRF分裂后,竞选失败的IRF会自动关闭所有成员设备上的部分端口(等效于在接口下执行
shutdown
命令),但有些端口不会被自动关闭,这些端口称为保留端口。缺省情况下,只有IRF物理端口是保留端口,如果要将其它端口(比如用于远程登录的端口)也作为保留端口,需要使用命令行进行手工配置。
·
关于LACP的详细介绍请参见“二层技术-以太网交换配置中的”中的“以太网链路聚合配置”;关于免费ARP的详细介绍请参见“三层技术-IP业务配置指导”中的“免费ARP配置”。
用户配置IRF前,要做好前期规划工作,需要明确IRF内各成员设备的角色和功能。因为有些参数的配置需要重启设备才能生效,所以建议用户按照下面的流程进行配置。
图1-6 IRF配置流程图
用户也可以在激活IRF端口配置后再进行IRF端口的连接,当设备检测到IRF端口正常连接后,将立刻开始角色选举,选举为Slave的设备将自动重启。
在IRF形成后,用户通过IRF中的任意一台设备进行登录,均可以对IRF系统进行配置和管理
表1-1 IRF
配置任务简介
1. IRF域简介
域是一个逻辑概念,设备通过IRF链路连接在一起就组成一个IRF,这些成员设备的集合就是一个IRF域。
为了适应各种组网应用,同一个网络里可以部署多个IRF,IRF之间使用域编号来以示区别。如
图1-7
所示,Switch A和Switch B组成IRF1,Switch C和Switch D组成IRF2。如果IRF1和IRF2之间有LACP MAD检测链路,则IRF1和IRF2会通过检测链路互相发送MAD检测报文,从而彼此影响IRF系统的状态和运行。这种情况下,可以给两个IRF配置不同的域编号,以保证两个IRF互不干扰。
配置IRF域编号后,成员设备发出的扩展LACP报文中将携带IRF域信息,用以区分不同IRF的LACP检测报文,避免与其它IRF产生混淆。
图1-7 多IRF
域示意图
2. 配置IRF域编号
在多个IRF均使用LACP MAD检测,且IRF间存在LACP MAD检测链路时,需要为各IRF配置不同的IRF域编号。在IRF间不存在LACP MAD检测链路,或使用ARP MAD检测的情况下,不需要配置IRF域编号。
表1-2 配置IRF域编号
l
IRF域编号的配置必须在开启LACP MAD检测功能之前进行。
l
虽然配置不同IRF域编号的设备之间可以建立IRF,但是建议用户为同一IRF中的成员设备配置统一的IRF域编号,否则会影响LACP MAD检测功能的正常运行。
l
在完成上述配置后,在任意视图下执行
display irf
命令可以显示IRF域编号的配置情况,通过查看显示信息验证配置的效果。
IRF通过成员编号唯一的识别各成员设备,设备上的许多信息、配置与成员编号相关,比如接口(包括物理接口和逻辑接口)的编号以及接口下的配置、成员优先级的配置等。
·
修改成员编号后,如果没有重启本设备,则原编号继续生效,各物理资源仍然使用原编号来标识;配置文件中,只有IRF端口的编号以及IRF端口下的配置、成员优先级的配置会跟着改变,其它配置均不会跟着改变。
·
修改成员编号后,如果保存当前配置,重启本设备,则新的成员编号生效,需要用新编号来标识物理资源;配置文件中,只有IRF端口的编号以及IRF端口下的配置、成员优先级会继续生效,其它与成员编号相关的配置(比如普通物理接口的配置等)不再生效,需要重新配置。
对于已经处于IRF中的设备,用户可以直接使用
表1-3
中的命令修改成员编号,但该配置需要在该成员设备重启之后才能生效。
对于尚未加入IRF的设备,如果需要使其以指定的编号加入IRF,推荐使用以下的顺序来进行配置:
(1) 预先规划好IRF新成员编号(查看IRF中所有成员的编号,找到没有被占用的编号)。
(2) 登录到将要加入IRF的设备,将其成员编号修改为步骤(1)中找到的空闲编号。
(3) 将设备断电,将设备与IRF相连,然后再将设备上电启动,并使用
表1-4
中介绍的配置来开启设备的IRF功能,将其加入IRF中。
表1-3 配置成员编号
·
该配置需要重启
member-id
标志的设备才能生效;
·
在IRF中以成员编号标志设备,修改设备成员编号可能导致设备配置发生变化或者丢失,请慎重配置。例如,IRF中有三台设备(编号为1、2、3),假定设备型号一样,每台设备都有若干端口,将设备2的成员编号改为3,将设备3的成员编号改为2,然后将设备2和3重启,再次加入IRF中,此时设备2将会使用先前设备3的接口配置,而设备3则使用先前设备2的端口配置。
IRF端口是一个逻辑的概念,只有配置IRF端口(即将IRF端口与IRF物理端口绑定)之后,设备的IRF功能才能使能。
在完成IRF连接,并将IRF物理端口与状态为DIS或DOWN(可以使用
display irf topology
命令来查看)的IRF端口进行绑定后,还需要通过
irf-port-configuration active
命令激活IRF端口的配置。在执行激活操作后,当IRF端口状态变为UP时,设备间会进行Master竞选,竞选失败的设备会自动重启并以Slave身份加入IRF。
表1-4 配置
IRF端口
·
多次执行
port group interface
,可以将IRF端口与多个IRF物理端口绑定,以实现IRF链路的备份/负载分担,从而提高IRF链路的带宽和可靠性。
·
将IRF物理端口与IRF端口进行绑定或解除绑定前,必须先将涉及到的IRF物理端口手工关闭(即在端口上执行
shutdown
命令);执行添加或者删除操作后,再将该IRF物理端口手工激活(即在端口上执行
undo
shutdown
命令)。由于信息交互的需要,系统软件对IRF物理端口能否被手工关闭进行了限制。如果不能被关闭,请根据提示信息关闭该端口直连的邻居设备上的端口。
·
以太网端口作为IRF物理端口与IRF端口绑定后,只支持
shutdown
和
description
命令。
shutdown
和
description
命令的详细描述请参见“二层技术-以太网交换命令参考”中的“以太网端口配置命令”。
·
如果用户在将IRF端口与IRF物理端口绑定时使用
mode
参数配置了绑定模式,则IRF链路两端的IRF端口绑定模式需要配置为一致。
在Master选举过程中,优先级数值大的成员设备将优先被选举成为Master设备。
表1-5 配置成员优先级
当网络中存在多个IRF或者同一IRF中存在多台成员设备且物理位置比较分散(比如在不同楼层甚至不同建筑)时,为了确认成员设备的物理位置,在组建IRF时可以将物理位置设置为成员设备的描述信息,以便后期维护。
表1-6 配置成员设备的描述信息
桥MAC是设备作为网桥与外界通信时使用的MAC地址。一些二层协议(例如LACP)会使用桥MAC标识不同设备。在二层报文转发过程中,如果报文的目的MAC是本设备的桥MAC,则表明此报文是发送给本设备的,否则直接丢弃。所以网络上的桥设备必须具有唯一的桥MAC。如果网络中存在两台桥MAC相同的设备,则会引起桥MAC冲突,从而导致通信故障。
IRF作为一台虚拟设备与外界通信,也具有唯一的桥MAC,称为IRF桥MAC。通常情况下使用Master设备的桥MAC作为IRF桥MAC。
因为桥MAC冲突会引起通信故障,桥MAC的切换又会导致流量中断。因此,用户需要根据网络实际情况配置IRF桥MAC的保留时间:
·
配置IRF桥MAC地址保留时间为6分钟。即当Master离开IRF时,IRF桥MAC地址6分钟内保持不变化;如果6分钟后Master没有回到IRF,则使用新选举的Master的桥MAC作为IRF桥MAC。该配置适用于Master设备短时间内离开又回到IRF的情况(比如Master重启或者链路临时故障等),可以减少不必要的桥MAC切换导致的流量中断。
·
如果配置了IRF桥MAC地址保留时间为永久,则不管Master设备是否离开IRF,IRF桥MAC始终保持不变。
·
如果配置了IRF桥MAC地址不保留,则当Master设备离开IRF时,系统立即会使用新选举的Master设备的桥MAC做IRF桥MAC。
表1-7 配置IRF的桥MAC保留时间
·
桥MAC变化可能导致流量短时间中断。
·
如果两个IRF的桥MAC相同,则它们不能合并为一个IRF。
·
当使用ARP MAD + MSTP组网时,需要将IRF配置为MAC地址立即改变,即配置
undo irf
mac-address persistent
命令。
·
如果没有使能自动加载功能,当参与IRF的设备软件版本与Master设备的不一致时,则新加入或者优先级低的设备不能正常启动。此时需要用户手工升级设备的软件版本后,再将设备加入IRF。
·
使能自动加载功能后,成员设备加入IRF时,会与Master设备的软件版本号进行比较,如果不一致,则自动从Master设备下载启动文件,然后使用新的系统启动文件重启,重新加入IRF。如果新下载的启动文件的文件名与设备上原有启动文件文件名重名,则原有启动文件会被覆盖。
表1-8 使能IRF系统启动文件的自动加载功能
·
当新加入设备的型号和Master当前运行的软件版本不配套时,自动加载功能可能不能正常工作。因此建议新设备加入IRF前,请确保新加入设备的型号和Master当前运行的软件版本配套。
·
为了缩短IRF形成的时间,从而减少对网络产生的影响,建议用户在将新设备加入IRF前,在新设备上加载与Master设备一致的软件版本。
·
Slave设备自动加载Master的启动文件后,会将该文件设置为Slave设备的下次启动文件,并使用该文件重启本设备。
·
为了能够自动加载成功,请确保Slave设备存储介质上有足够的空闲空间用于存放新的启动文件。
配置IRF链路状态变化延迟上报功能后,如果IRF链路状态变化(从up变为down或从down变为up),端口不会立即向系统报告链路状态变化。经过配置的时间间隔后,如果IRF链路状态仍然没有恢复,端口才向系统报告链路状态的变化,系统再作出相应的处理。
该功能用于避免因端口链路层状态在短时间内频繁改变,导致IRF分裂/合并的频繁发生。
表1-9 配置IRF链路状态变化延迟上报功能
IRF支持的MAD检测方式有LACP MAD检测和ARP MAD检测。两种检测方式虽然原理不同但是功能效果相同,能够满足不同组网需求:
·
LACP MAD检测用于基于LACP的组网检测需求;
·
ARP MAD检测用于基于非聚合场合的Resilient ARP的组网检测需求。
这两种方式独立工作,彼此之间互不干扰。因此,同一IRF内可以同时配置这两种MAD检测方式。
1. LACP MAD检测
(1) LACP MAD检测原理
LACP MAD检测是通过扩展LACP协议报文内容实现的,即在LACP协议报文的扩展字段内定义一个新的TLV(type length value)数据域——用于交互IRF的ActiveID。对于IRF系统来说,ActiveID的值是唯一的,用IRF中Master设备的成员编号来表示。
使能LACP MAD检测后,成员设备通过LACP协议报文和其它成员设备交互ActiveID信息。
·
当IRF正常运行时,所有成员设备发送的LACP协议报文中的ActiveID值相同,没有发生多Active冲突;
·
当IRF分裂后会形成两个或多个IRF时,不同IRF中的成员设备发送的LACP协议报文中的ActiveID值不同,从而检测到多Active冲突。
(2) LACP MAD检测组网要求
LACP MAD检测方式组网中需要使用中间设备,支持LACP协议扩展功能的H3C设备都能作为中间设备(H3C设备是否支持LACP协议扩展功能请参见该设备操作手册中“LACP协议”部分的相关描述)。通常采用如
图1-8
所示的组网:成员设备之间通过Device交互LACP扩展报文。
图1-8 LACP MAD
检测组网示意图
(3) 配置LACP MAD检测
LACP MAD检测的配置步骤为:
·
创建二层聚合端口;(中间设备上也需要进行该项配置)
·
将聚合端口的工作模式配置为动态聚合模式;(中间设备上也需要进行该项配置)
·
在动态聚合端口下使能LACP MAD检测功能;
·
给聚合组添加成员端口。(中间设备上也需要进行该项配置)
表1-10 配置LACP MAD检测
2. ARP MAD检测
(1) ARP MAD检测原理
ARP MAD检测是通过扩展免费ARP协议报文内容实现的,即使用免费ARP协议报文中未使用的字段来交互IRF的ActiveID。对于IRF系统来说,ActiveID的值是唯一的,用IRF中Master设备的成员编号来表示。
使能ARP MAD检测后,成员设备可以通过免费ARP协议报文和其它成员设备交互ActiveID信息。
·
当IRF正常运行时,所有成员设备发送的免费ARP协议报文中的ActiveID值相同,没有发生多Active冲突;
·
当IRF分裂后会形成两个或多个IRF,不同IRF中的成员设备发送的免费ARP协议报文中的ActiveID值不同,从而检测到多Active冲突。
(2) ARP MAD检测组网要求
ARP MAD检测方式可以使用中间设备来进行连接,也可以不使用中间设备。通常采用如
图1-9
所示的组网:成员设备之间通过Device交互免费ARP报文,Device、Master和Slave上都要配置MSTP功能,以防止形成环路。
图1-9 ARP MAD
检测组网示意图
(3) 配置ARP MAD检测
表1-11 配置ARP MAD检测
3. 配置保留接口
IRF系统在进行多Active处理的时候,缺省情况下,会关闭Recovery状态设备上的所有业务接口。如果接口有特殊用途需要保持up状态(比如Telnet登录接口等),则用户可以通过命令行将这些接口配置为保留接口。
表1-12 配置保留接口
l
IRF物理端口自动作为保留接口,不需要配置。
l
如果要求处于Recovery状态的IRF中的某个VLAN接口能够继续收发报文(比如使用该VLAN接口进行远程登录),则需要将该VLAN接口以及该VLAN接口对应的以太网端口都配置为保留接口。但如果在Active状态的IRF中该VLAN接口也处于UP状态,则在网络中会产生IP地址冲突。
4. MAD故障恢复
IRF链路故障将一个IRF分裂为两个IRF,从而导致多Active冲突。当系统检测到多Active冲突后,两个冲突的IRF会进行竞选,Master成员编号小的获胜,继续正常运行,失败的IRF会转入Recovery状态,暂时不能转发业务报文。此时通过修复IRF链路可以恢复IRF系统(设备会尝试自动修复IRF链路,如果修复失败的话,则需要用户手工修复)。
IRF链路修复后,处于Recover状态的IRF会自动重启,从而与处于Active状态的IRF重新合并为一个IRF,原Recovery状态IRF中被强制关闭的业务接口会自动恢复到真实的物理状态,如
图1-10
所示。
图1-10 MAD
故障恢复(IRF链路故障)
如果在IRF链路修复之前,处于Active的IRF也出现故障(原因可能是设备故障或者上下行线路故障),如
图1-11
所示,可以在IRF 2(处于Recovery状态的IRF)上执行
mad restore
命令,让IRF 2恢复到正常状态(无需重启),先接替IRF 1工作,然后再修复IRF 1和IRF链路。完成修复工作后,两个IRF发生合并,此时双方将通过比较各自Master设备成员优先级的方式进行竞选,成员优先级高的Master所在IRF获胜,保持正常工作状态,竞选失败的Master所在IRF中的所有设备将自动重启并加入获胜方IRF,完成IRF合并过程,整个IRF系统恢复。
图1-11 MAD
故障恢复(IRF链路故障+Active状态的IRF故障)
表1-13 手动恢复处于Recovery状态的设备
IRF的访问方式如下:
·
本地登录:通过任意成员设备的Console口登录。
·
远程登录:给任意成员设备的任意三层接口配置IP地址,并且路由可达,就可以通过Telnet、WEB、SNMP等方式进行远程登录。
不管使用哪种方式登录IRF,实际上登录的都是Master。Master是IRF系统的配置和控制中心,在Master上配置后,Master会将相关配置同步给Slave,以便保证Master和Slave配置的一致性。
用户访问IRF时,实际访问的是IRF中的Master设备,访问终端的操作界面显示的是Master设备的控制台。如果要打印Slave设备的日志、调试等信息,需要重定向到Slave。重定向之后,用户访问终端的操作界面就会从Master的控制台切换到指定Slave的控制台,系统进入Slave的用户视图,“<
系统名
-
Slave#X
>”,其中“X”为成员设备编号,例如“<Sysname-Slave#2>”。用户从终端的输入指令都会转发给指定的Slave,Master不再进行处理。目前在Slave上只允许执行以下命令:
·
display
·
quit
·
return
·
system-view
·
debugging
·
terminal debugging
·
terminal trapping
·
terminal logging
用户可以使用
quit
命令退回到Master控制台,此时Master控制台重新激活,可以向外输出日志等信息。
表1-14 访问Slave
1.8.1 IRF
典型配置举例(LACP MAD检测方式)
1. 组网需求
由于公司人员激增,接入层交换机提供的端口数目已经不能满足PC的接入需求。现需要在保护现有投资的基础上扩展端口接入数量,并要求网络易管理、易维护。
2. 组网图
图1-12 IRF
典型配置组网图(LACP MAD检测方式)
3. 配置思路
·
Device A提供的接入端口数目已经不能满足网络需求,需要另外增加一台设备Device B。(本文以两台设备组成IRF为例,在实际组网中可以根据需要,将多台设备组成IRF,配置思路和配置步骤与本例类似)
·
鉴于第二代智能弹性架构IRF技术具有管理简便、网络扩展能力强、可靠性高等优点,所以本例使用IRF技术构建接入层(即在Device A和Device B上配置IRF功能)。
·
为了防止万一IRF链路故障导致IRF分裂、网络中存在两个配置冲突的IRF,需要启用MAD检测功能。因为接入层设备较多,我们采用LACP MAD检测。
4. 配置步骤
为便于区分,下文配置中假设IRF形成前Device A的系统名称为DeviceA,Device B的系统名称为Device B;中间设备Device C的系统名称为DeviceC。
(1) 配置设备编号
# Device A保留缺省编号为1,不需要进行配置。
# 在Device B上将设备的成员编号修改为2。
<DeviceB> system-view
[DeviceB] irf member 1 renumber 2
Warning: Renumbering the switch number may result in configuration change or loss. Continue? [Y/N]:y
[DeviceB]
(2) 将两台设备断电后,按
图1-12
所示连接IRF链路,然后将两台设备上电。
# 在Device A上创建设备的IRF端口2,与物理端口GigabitEthernet1/0/49绑定,并保存配置。
<DeviceA> system-view
[DeviceA] interface gigabitethernet 1/0/49
[DeviceA-GigabitEthernet1/0/49] shutdown
[DeviceA] irf-port 1/2
[DeviceA-irf-port1/2] port group interface gigabitethernet 1/0/49
[DeviceA-irf-port1/2] quit
[DeviceA] interface gigabitethernet 1/0/49
[DeviceA-GigabitEthernet1/0/49] undo shutdown
[DeviceA-GigabitEthernet1/0/49] save
#
在
Device B
上创建设备的
IRF
端口
1
,与物理端口
GigabitEthernet2/0/50
绑定,并保存配置。
<DeviceB> system-view
[DeviceB] interface gigabitethernet 2/0/50
[DeviceB-GigabitEthernet2/0/50] shutdown
[DeviceB] irf-port 2/1
[DeviceB-irf-port2/1] port group interface gigabitethernet 2/0/50
[DeviceB-irf-port2/1] quit
[DeviceB] interface gigabitethernet 2/0/50
[DeviceB-GigabitEthernet2/0/50] undo shutdown
[DeviceB-GigabitEthernet2/0/50] save
#
激活
DeviceA
的
IRF
端口配置。
[DeviceA-GigabitEthernet1/0/49] quit
[DeviceA] irf-port-configuration active
#
激活
DeviceB
的
IRF
端口配置。
[DeviceB-GigabitEthernet2/0/50] quit
[DeviceB] irf-port-configuration active
(3) 两台设备间会进行
Master
竞选,竞选失败的一方将自动重启,重启完成后,IRF形成,系统名称统一为DeviceA。
(4) 配置LACP MAD检测
#
创建一个动态聚合端口,并使能LACP MAD检测功能。
<DeviceA> system-view
[DeviceA] interface bridge-aggregation 2
[DeviceA-Bridge-Aggregation2] link-aggregation mode dynamic
[DeviceA-Bridge-Aggregation2] mad enable
[DeviceA-Bridge-Aggregation2] quit
# 在聚合接口中添加成员端口GigabitEthernet1/0/1和GigabitEthernet2/0/1,专用于两台IRF成员设备与中间设备进行LACP MAD检测。
[DeviceA] interface gigabitethernet 1/0/1
[DeviceA-GigabitEthernet1/0/1] port link-aggregation group 2
[DeviceA-GigabitEthernet1/0/1] quit
[DeviceA] interface gigabitethernet 2/0/1
[DeviceA-GigabitEthernet2/0/1] port link-aggregation group 2
(5) 中间设备Device C的配置
Device C作为一台中间设备需要支持LACP功能,用来转发、处理LACP协议报文,协助Device A和Device B进行多Active检测。从节约成本的角度考虑,使用一台支持LACP功能的交换机即可。
#
创建一个动态聚合端口。
<DeviceC> system-view
[DeviceC] interface bridge-aggregation 2
[DeviceC-Bridge-Aggregation2] link-aggregation mode dynamic
[DeviceC-Bridge-Aggregation2] quit
# 在聚合端口中添加成员端口GigabitEthernet1/0/1和GigabitEthernet1/0/2,用于进行LACP MAD检测。
[DeviceC] interface gigabitethernet 1/0/1
[DeviceC-GigabitEthernet1/0/1] port link-aggregation group 2
[DeviceC-GigabitEthernet1/0/1] quit
[DeviceC] interface gigabitethernet 1/0/2
[DeviceC-GigabitEthernet1/0/2] port link-aggregation group 2
#
按
图1-12
所示连接
LACP MAD
链路。
1.8.2 IRF
典型配置举例(ARP MAD检测方式)
1. 组网需求
由于网络规模迅速扩大,当前中心交换机(Device A)转发能力已经不能满足需求,现需要在保护现有投资的基础上将网络转发能力提高一倍,并要求网络易管理、易维护。
2. 组网图
图1-13 IRF
典型配置组网图(ARP MAD检测方式)
3. 配置思路
·
Device A处于局域网的汇聚层,为了将汇聚层的转发能力提高一倍,需要另外增加一台设备Device B。
·
鉴于第二代智能弹性架构IRF技术具有管理简便、网络扩展能力强、可靠性高等优点,所以本例使用IRF技术构建网络接入层(即在Device A和Device B上配置IRF功能),IRF通过双链路上行。
·
为了防止万一IRF链路故障导致IRF分裂、网络中存在两个配置冲突的IRF,需要启用MAD检测功能。因为成员设备比较少,我们采用ARP MAD检测方式来监测IRF的状态,复用链路上行传递ARP MAD报文。为防止环路发生,在IRF和Device C上启用MSTP功能。
4. 配置步骤
为便于区分,下文配置中假设IRF形成前Device A的系统名称为DeviceA,Device B的系统名称为Device B;中间设备Device C的系统名称为DeviceC。
(1) 配置设备编号
# Device A保留缺省编号为1,不需要进行配置。
# 在Device B上将设备的成员编号修改为2。
<DeviceB> system-view
[DeviceB] irf member 1 renumber 2
Warning: Renumbering the switch number may result in configuration change or loss. Continue? [Y/N]:y
[DeviceB]
(2) 将两台设备断电后,按
图1-13
所示连接IRF链路和ARP MAD检测链路,然后将两台设备上电。
# 在Device A上创建设备的IRF端口2,与物理端口GigabitEthernet1/0/49绑定,并保存配置。
<DeviceA> system-view
[DeviceA] interface gigabitethernet 1/0/49
[DeviceA-GigabitEthernet1/0/49] shutdown
[DeviceA] irf-port 1/2
[DeviceA-irf-port1/2] port group interface gigabitethernet 1/0/49
[DeviceA-irf-port1/2] quit
[DeviceA] interface gigabitethernet 1/0/49
[DeviceA-GigabitEthernet1/0/49] undo shutdown
[DeviceA-GigabitEthernet1/0/49] save
#
在
Device B
上创建设备的
IRF
端口
1
,与物理端口
GigabitEthernet2/0/50
绑定,并保存配置。
<DeviceB> system-view
[DeviceB] interface gigabitethernet 2/0/50
[DeviceB-GigabitEthernet2/0/50] shutdown
[DeviceB] irf-port 2/1
[DeviceB-irf-port2/1] port group interface gigabitethernet 2/0/50
[DeviceB-irf-port2/1] quit
[DeviceB] interface gigabitethernet 2/0/50
[DeviceB-GigabitEthernet2/0/50] undo shutdown
[DeviceB-GigabitEthernet2/0/50] save
#
激活
DeviceA
的
IRF
端口配置。
[DeviceA-GigabitEthernet1/0/49] quit
[DeviceA] irf-port-configuration active
#
激活
DeviceB
的
IRF
端口配置。
[DeviceB-GigabitEthernet2/0/50] quit
[DeviceB] irf-port-configuration active
(3) 两台设备间将会进行
Master
竞选,竞选失败的一方将自动重启,重启完成后,IRF形成,系统名称统一为DeviceA。
(4) 配置ARP MAD
#
在
IRF
上全局使能
MSTP
,以防止环路的发生。
<DeviceA> system-view
[DeviceA] stp enable
#
按
图1-13
所示连接
ARP MAD
检测链路。
#
将
IRF
配置为
MAC
地址立即改变。
[DeviceA] undo irf mac-address persistent
#
创建
VLAN 3
,并将
Device A
(成员编号为
1
)上的端口
GigabitEthernet1/0/1
和
Device B
(成员编号为
2
)上的端口
GigabitEthernet2/0/1
加入
VLAN
中。
[DeviceA] vlan 3
[DeviceA-vlan3] port gigabitethernet 1/0/1 gigabitethernet 2/0/1
[DeviceA-vlan3] quit
#
创建
VLAN-interface3
,并配置
IP
地址,使能
ARP MAD
检测功能。
[DeviceA] interface vlan-interface 3
[DeviceA-Vlan-interface3] ip address 192.168.2.1 24
[DeviceA-Vlan-interface3] mad arp enable
(5)
配置Device C
#
在全局使能
MSTP
,以防止环路的发生。
<DeviceC> system-view
[DeviceC] stp enable
# 创建VLAN 3,并将端口GigabitEthernet1/0/1和GigabitEthernet1/0/2加入VLAN 3中,用于转发ARP MAD报文。
[DeviceC] vlan 3
[DeviceC-vlan3] port gigabitethernet 1/0/1 gigabitethernet 1/0/2
[DeviceC-vlan3] quit