电子说
过去几年,运营商网络转型成为了行业内一个无法回避的核心话题。一方面,现有业务的增长压力和市场竞争的形势变化,以及5G 进程的加快对对网络基础设施建设提出了新的要求,使得转型需求日益迫切;另一方面,虚拟化、云计算、SDN等新兴技术的发展,也为转型的实现提供了现实可能。
从最早被提出以来,短短数年之间,NFV已经在众多运营商和厂商的积极参与推动下,从纸面上的概念迅速进入到落地实施阶段,并被广泛认为是未来5G网络等新兴业务的基本建设模式。通过将网络基础设施(NFVI + VIM,下文概括称为NFVI)、上层网络业务(VNF)和管理编配系统(MANO)进行分层解耦,NFV为未来的运营商网络绘制出了一幅开放、灵活、自动化的演进蓝图,从理论上为运营商的网络转型和业务创新提供了基本依据。
NFV的商用对NFVI提出的若干关键诉求应当看到,NFV在为网络转型展示了美好前景的同时,也确实引入了一些不容忽视的技术挑战。具体到NFVI领域中,通过分析近年来海内外运营商的实践案例,则可以总结出以下几个需要重点关注的问题。
首先,基于IT化技术体系的NFVI实现方案能否承载电信级的网络业务。
长期以来,电信运营商一直以其先进的电信技术体系提供着体验优异、安全可靠的各类网络业务,由此支撑起整个社会经济的平稳运行,担负起至关重要的信息化基础设施职责。
而当进入NFV时代之后,网络业务迁移到以COTS硬件和开源软件为主体组成的NFVI之上,其性能、可靠性和安全性等能力是否还能满足既有的业务要求?技术创新所引入的风险是否会影响用户体验?这些问题的答案,无疑成为了NFV能否商用的先决条件。
其次,NFVI架构方案是否能够支撑网络业务的持续演进与创新。
不难想象,在市场竞争和技术变革的双重驱动下,运营商网络的转型与创新,将会成为一个长期持续的过程,甚至可能成为运营商所面临的新常态。在这一背景下,对NFVI的各类技术需求必将持续不断地出现。换言之,业务的演进也会驱动着NFVI自身的不断演进。
因此,NFVI的规划设计者需要正视以下这个问题:怎样的NFVI架构方案才能实现与业务需求持续匹配的灵活演进?例如,为4G业务建设的NFVI是否能够平滑演进以满足5G业务部署的要求?这些问题直接关系到NFVI能否真正支撑网络转型战略目标的落地,也关系到能否避免由于规划因素造成的技术风险和投资浪费。
第三,如何正确处理NFVI的开放性与集成交付难度之间的矛盾关系。
技术体系与系统架构的开放性对于NFVI至关重要。只有开放的NFVI,才能有效促进网络业务和厂商生态的多元化,以便让网络转型的效益最大化。
与此同时,也应该看到,由于和NFV相关的各项技术规范尚且未完善,无论是NFVI北向与VNF、MANO的对接,还是NFVI内部与COTS硬件或虚拟化软件的集成,都还存在一些缺少标准的领域。这种情况极易导致多厂商产品方案的集成交付出现各种风险,从而阻碍NFV的商用落地。
运营商建设NFVI时的关注点针对上述几个方面的问题,运营商在规划、设计与建设NFVI时,需要特别关注以下几个技术方面。
一、对NFVI进行合理的加固与增强,使其真正符合电信级业务的质量要求。
能够承载电信级业务的NFVI,需要在高性能、高可靠、高安全等多个方向上进行全面深入的加固与增强,使自身达到电信级的技术要求。
就高性能而言,高吞吐、低延迟的虚拟网络转发技术至关重要。高性能的虚拟交换机一方面关系到NFVI的转发能力是否满足vEPC、vBRAS等已有业务的商用要求,另一方面也是影响5G、视频等新类型业务在NFVI平台上商用体验的关键。同时,性能的提升也意味着相同业务规模下成本的下降,有着明确的商业价值。
由于摩尔定律自身逐渐走向终结,依靠通用处理器的性能提升来持续大幅提高转发性能的思路已经不可持续。而与此同时,基于SR-IoV的硬件虚拟化技术提供了另外一种解决问题的替代选择。长远看来,基于软件虚拟化与硬件虚拟化的不同网络转发技术,会在NFV领域中长期并存,分别在不同业务场景下发挥重要作用。
就高可靠而言,关键在于对系统的可靠性进行全景式、多层次、多领域的详细分析与加固,确保系统中不存在单点故障点,并能够在各种故障场景下保障上层业务达成5个9的电信级高可用性。
为达到这一目的,需要对NFVI方案内部的数据面、控制面、管理面、运维面的各个组件进行合理加固,综合使用秒级故障告警、控制组件故障自动恢复、虚拟机故障自动恢复、业务数据自动备份、数据中心级本/异地容灾等多种技术手段,全面保障系统可靠性。
安全是NFV领域中日益受到关注的一个新课题。从封闭的、一体化集成的传统电信设备,走向开放化、分层解耦的NFV系统,业务安全性的保障确实需要更多的关注。除计算、网络、存储等虚拟化技术支持的租户级安全隔离能力之外,还需要从物理基础设施安全、系统软件安全、业务数据安全、系统安全管理等多个视角对NFVI的安全性进行审视与加固。
除此之外,易运维性也是NFVI在商用过程中面对的关键问题。针对由IT化技术体系构建起来的NFVI,其运维工作自然也包含了IT系统运维领域中的方方面面,安装部署、升级补丁、变更扩容、监控告警、故障管理等均是运维团队不可忽视的实际任务。这也给NFVI的运维系统提出了很高的技术要求。举例而言,当NFVI计算节点物理主机上的Linux操作系统需要进行升级时,如何实现业务不中断前提下的全集群自动化升级就是一个颇有难度的挑战。如果这些问题解决不好,则直接影响NFVI的可商用性。为此,则需要在NFVI解决方案的生命周期管理系统中,引入强大的自动化升级流程管理系统,以便能够以程序化、自动化的方式协调业务迁移和节点升级操作之间的次序关系,在加速升级过程、降低升级风险的同时,减轻运维团队的升级工作压力。
综上,性能、可靠性、安全性、可运维性这四个方面,均需要在设计NFVI的过程中予以高度重视。
二、为了能够有效支撑运营商业务的持续演进,NFV必将走向NFC(Network Function Cloudification),所以NFVI的设计需要充分的灵活性。
可以预期,运营商未来的网络,必将从以电信机房为基础的组网建设模式,转向以分布式多级多数据中心为基础的组网建设模式。不同规模与级别的数据中心,分布在不同的地理位置,并提供不同类型的云化资源池和不同级别的网络接入延迟,以支持不同类型业务的分布式部署和广地域覆盖。在此基础上,由于未来5G网络对于毫秒级超低延迟业务的支持诉求,NFVI需要考虑在网络的边缘支持大量的、小规模的边缘站点。因此,支持上述多级多中心和边缘站点共同组网、集中化管理,就成为了NFVI的关键能力。
同时,多元化的业务对于NFVI也会提出多元化的资源类型诉求。因此,在NFVI方案的架构中,需要充分考虑对不同类型的计算、存储、网络等资源进行异构接入的可能性。例如,在计算领域,既需要提供虚拟机作为基础计算资源,也需要考虑为部分特殊的高性能业务直接提供裸机资源;既需要能够支持通用的x86处理器,也需要考虑面向一些计算密集型业务提供FPGA等高性能异构计算资源。
在此基础上,NFVI也应当具备与上层的容器集群管理平台进行集成,支撑容器化业务的能力,例如支持敏捷的5G核心网业务。但NFVI本身与容器管理平台、乃至于PaaS层,仍应当保持解耦,以避免NFVI自身架构过于臃肿,影响其自身的可演进性和部署使用的灵活性。
三、需要考虑NFVI厂商的开放性,共同促进NFV领域的生态形成,同时考虑厂商端到端解决方案的交付能力。
面对系统开放性与集成交付风险之间的矛盾,运营商可以考虑与NFVI业界一流厂商密切合作,共同推动主流商用场景下,各厂商VNF、MANO等组件与主流NFVI方案之间的商用对接验证,并形成相关技术规范。同时考虑厂商端到端解决方案的交付能力,以保证快速交付和后续的服务。
小结综上所述,NFVI在进入生产部署的过程当中,确实还存在一些需要重点关注的技术挑战。但是,华为在全球各地实际参与的众多实践案例表明,遵循ETSI定义的NFVI标准参考架构,基于现有的技术能力与实践积累,选定演进路径,端到端的考虑解决方案设计实施,则这些挑战都是可以被有效解决的。随着虚拟化、云计算、SDN等多种技术的进步,NFV必然会趋向成熟,并逐步演进至NFC(Network Function Cloudification),以支撑原生云化(cloud-native)的网络业务。云化的NFVI必将成为运营商未来5G网络的标准基础设施,并为运营商业务的演进与创新带来无限可能。
作者:章宇
华为技术有限公司 IT产品线NFVI解决方案首席架构师
2002年及2007年先后于清华大学电子工程系获得学士及博士学位。
章宇博士曾任华为FusionSphere OpenStack产品架构师。
在加入华为之前,章宇博士曾于IBM中国研究院担任高级研究员。
全部0条评论
快来发表一下你的评论吧 !