伴随着各行各业数字化进程的不断加速,越来越多的行业进入多云、多元算力时代。多样化的算力在未来5年将持续快速增长,例如最近火爆的超大模型训练,背后就离不开强大算力的支撑,它的出现就像一把钥匙开启了多元算力时代的大门,驱动多样性算力需求的爆发式增长,使得数据中心加速迈入AI时代。
而作为算力的关键承载之一的数据中心网络,需要持续演进以适应新时代的挑战。9月20日,在华为2023全联接大会上,华为基于L3.5数据中心自动驾驶网络在多云多厂商网络内实现高度自动化的基础上,进一步面向全球发布L4数据中心自动驾驶网络方案及白皮书,将目光瞄准数据中心多元化算力网络中,通用算力网络与大模型训练为代表的智能算力网络间网络自动驾驶水平参差不齐的现状,以及资源广泛云化带来的云开支的不可控问题,帮助客户实现数据中心多元算力网络的端到端高度自动化及成本运营。
数据中心网络新挑战
白皮书指出,随着数据中心网络运维由以通用计算为代表的通用算力保障向存储、高性能计算及智能计算等多元化算力保障演进,数据中心也面临新的挑战:
IT团队和网络团队使用不同的工作视图,多视图割裂导致业务出现异常时需要多部门人肉式协同定位故障,难以满足业务持续稳定运行的要求;
大模型训练的兴起,引发智能算力网络的爆发式需求增长,而其业务及流量模型独有特点导致通用算力网络运维调优手段难以奏效,算力平均使用率不足40%;
资源云化,为客户带来便利的同时,也带来开支的不可控。传统的运营方式,成本,质量,预算预测等分析依赖大量人工参与,基于经验测算无法实现精准化运营实施,如何减少资源浪费,实现降本增效成为数据中心管理者的新难题。
L3.5→L4,华为致力于解决多元算力网络下自动驾驶难题
L3.5实现了多云多厂商全场景网络服务化,支持多云协同、网络全量基础原子能力的开放,助力企业业务在复杂异构网络环境下也能够敏捷创新。L4则是在此基础上将边界从通用算力延展到智算+通算的多元算力,将维度由网络运维提升到网络运营层面。全方位升级的网络自动驾驶能力帮助客户在多元算力网络中敏捷创新的同时能够像使用“水电煤”一样灵活进行资源分配优化。
具体展开来看,在核心部件iMaster NCE智能管控&分析系统的支持下,华为L4数据中心自动驾驶网络方案从如下几个方面解决上述难题:
01 全栈可观测:提供网络数字地图,内置还原算法,100%还原物理网络,应用网络拓扑;低码化、高速接入平台让网络数据快速平滑接入。通过内置的路径导航算法,给出应用网络路径全景,集合全流采集分析等技术叠加高质量路况信息可视,实现多视图一张图可视。
02 智能算力加速:基于实时高精度高性能数据采集,对网络各维度统一建模,结合智能算法技术对全网计算,给出最优的网络加速方案,提升算力网络吞吐效率,降低智能算力所需训练时长。
03 应用智能保障:基于Telemetry技术实时采集100+数据,利用智能全流分析方案,构筑覆盖DC内跨厂商跨Fabric跨异构组网的全路径、全流、全包的应用流分析能力。通过关系图分析算法,自动梳理应用质量画像和应用间互访关系,实时检测应用质量异常,实现分钟级应用报障及智能闭环。
04 精细化智能运营:建立应用,网络,资源等全量维度的统一模型,基于全流智能分析得到质量,体验类数据,智能化分析给出资源使用热点、成本等运营画像,结合算法给出业务搬迁,位置部署,扩缩容等精细化运营建议。
数据中心自动驾驶网络从1到N是长期实践,需要产业各方携手推进
自动驾驶网络从1到N是一个长期实践、发展演进的过程,除了标准和技术,还需要业界持续深化自动驾驶网络评估体系建设,以牵引网络自动化/智能化升级和代际演进。华为一直致力于自动驾驶网络关键技术的研究与突破,典型场景的探索与应用,并取得了阶段性的成果。华为愿意一直携手各方产业伙伴,凝聚共识、大胆尝试、坚定前行,持续推进网络AI技术的大规模成熟应用,加速数据中心网络迈向使能敏捷商业、极致体验与高效运维的自动驾驶时代。
点击“阅读原文”,了解更多华为数据通信资讯!
原文标题:华为全联接大会2023|瞄准多元算力网络挑战,华为发布L4数据中心自动驾驶网络方案
文章出处:【微信公众号:华为数据通信】欢迎添加关注!文章转载请注明出处。
全部0条评论
快来发表一下你的评论吧 !