最新网络收敛时间测试技术介绍

通用测试仪器

199人已加入

描述

介绍了实现网络快速收敛的相关协议以及引起收敛的原因,IXIA正在申请专利的集成在IxNetwork产品中TrueView网络收敛时间测试技术和传统技术的差异。

网络

1  引言

收敛(Convergence)描述了网络从故障恢复以及网络变更的方式。现代网络通过提供冗余或备用路径来应对预期的网络故障。故障倒换是指网络自动检测服务中断和调整并切换到备用路径的过程。重路由的信息流重新归并到无故障路径某点时,传输网络即发生了收敛。与之相反,故障倒回则是指修复服务中断后网络恢复至初始链路的过程。

从技术上而言,所有受影响路由从主路径切换到备用路径后网络路由收敛才会视为完成。

2  网络收敛时间测试方案

2.1  实现快速收敛的协议介绍

在OSI模型的第2层,如果出现链接故障或网络变更,STP,RSTP,MSTP和LDP/RSVP-TE等交换协议便会提供流量重定向机制。如果出现链接或网络故障,第3层的RIP,OSPF,ISIS和BGP等路由协议有能力重路由IP流量。这些传统技术需要数秒方可完成,实际时间取决于其所处理网络的规模和复杂性。下一代网络要求快得多的恢复时间,以满足其高可用性要求。为实现快速故障倒换时间,众多扩展协议和新协议已被使用。这些协议包括:

(1)平滑无中断重启:路由器向邻近路由器发送其正在重启路由过程的消息,并要求邻近路由器在其重启期间继续转发数据包。

(2)虚拟路由器冗余协议(VRRP):定义并宣告一个“虚拟的”路由器为网关,两个或更多路由器为该网关提供服务。

(3)MPLS快速重路由:本地网络保护恢复机制。每条LSP均受备用路径保护。此机制满足实时应用要求,可以达到SONET环路不到50ms的恢复时间。

(4)双向转发检测:一种简单、高速的HELLO协议,可提供低开销、短期(低至1ms)的路径故障检测。

(5)OAM/CFM链接:提供以太网链接和服务故障检测和隔离。CFM可以完成低至10ms的服务中断检测的时间。

(6)协议计时器设置:网络通常使用路由协议的相对低速的HELLO机制,在硬件没有发送求助信号时检测故障。许多计时器均可以调低以减少反应时间。

服务提供商在服务等级协议(SLA)中向企业客户保证其服务的可靠性级别,通常为99.999%。这听起来毫无价值,但99.999%可靠性保证意味着一年中断累计时间超过5min。此项极富挑战性的要求导致网络服务提供商实施多项功能,最大限度地缩短故障时间,加快收敛时间。

受故障倒换影响的不仅仅是路由协议。路由器还需要转发大量流量,同时执行服务质量(QoS)和其他策略。信息服务器和负载均衡设备必须对付丢弃的包文和连接的冲击。因此,收敛测试必须在网络流量模仿用户真实负载的环境中进行。

2.2  网络中断的原因

网络连接中断的原因有很多,从明显的电源故障或线路切断到设备配置错误,或软件错误和升级导致的故障。以下的讨论旨在调查不同网络堆栈等级造成或发生的故障。

(1)第1层——物理层中断

导致物理层网络中断的故障范例包括:

●断电。即使是短暂的停电也会导致故障发生。

●线路切断。瞬时故障可视为线路切断所致。

●设备故障。可能是电源故障,损坏的内存,CPU插件故障或接口插件故障所致。

SONET网络包括此类故障的内置保护部件,但以太网没有此类内置保护部件。虽然物理网络连接拥有许多可行的选择,但以太网将作为下一代网络选择的要素显而易见。无论以太网链接使用的是铜线还是光纤,物理层设备(PHY)的管理界面只提供最低的链接故障可见度。至于网络接口方面,链接要么接上,要么没有接上。有效监测链接状况必须用到如OAM链接等更高级别的协议。

(2)第2层——数据连接层中断

交换机是第2层最常见的设备。导致第2层故障的原因可归类如下:

●容量。MAC地址数目达到容量极限。

●环境。环境过热可导致设备无法正常运行。

●硬件/软件故障。如果没有妥善规划并测试,IT网络操作人员移动、添加和更改软、硬件均会诱导硬件或软件故障。

●事件。认证问题(例如802.1x)、互操作性或配置错误。

故障发生的方式各种各样,包括流量泛滥或突降、流量受损、连接中断、高延时以及低性能、导致性能下降的间歇性流量突降、网络连接受限。

数据链接层使用的大多数协议均没有提供连接故障检测机制。举例来说,ARP协议被用于映射主机MAC地址到第3层IP地址,但是如果ARP失效,便没有任何恢复机制了。

有几种协议可解决第2层的故障,其中包括生成树,链接OAM,服务OAM,MPLS/RSVP-TE和BFD。STP,RSTP和MSTP等以太网生成树协议用于为交换网络提供冗余。这要求网络管理员仔细配置,以取得最佳性能,但仍然不会迅速收敛。

目前,有许多新协议正在加以标准化,以实现50ms或用时更少的收敛时间。目前,可用的快速故障检测和恢复的协议包括第2层(链接OAM,服务OAM,RSVP-TE快速重路由)和第3层(OSPF快速发送HELLO,双向转发检测BFD,虚拟路由器冗余协议VRRP)。

这些协议旨在检测故障,但通常需要与其他路由协议搭配使用,才能完成故障恢复。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分