电子说
2022年上半年 NVIDIA DOCA 1.3版本发布,对于开发者们更好地使用DPU,尤其是新一代的英伟达BlueField DPU进行简单灵活的软件开发,有着更好的帮助。7月5日,英伟达的相关技术专家和首届NVIDIA DPU中国黑客松优秀开发者一起线上作了精彩的分享。
DOCA是Data-Center-Infrastructure-On-A-Chip-Architecture的缩写,也就是“线上数据中心基础设施体系结构”。它是一个为BlueField DPU量身定做的软件开发平台,主要的目的是为开发者打造一个全面开放的开发平台,支持广大开发者可以在BlueField DPU上进行简单灵活的软件开发,让开发者可以快速地创建BlueField DPU,加速高性能的一些应用程序和服务。DOCA是依托于面向未来的API驱动的思维模式来构建的,可以让BlueField DPU硬件加速变得更加易用,从而实现非凡的数据中心的性能、效率,还有安全性。DOCA使开发者能够利用行业标准的API,在BlueField DPU上做快速的创建应用程序和服务,类似于我们GPU上的CUDA,它能够解锁数据中心里的创新功能,并且能够更好地向下一代或者未来新一代BlueField DPU来做兼容性和进一步的持续支持。DOCA可以加快应用程序和服务的上市时间,让合作伙伴和客户在各自竞争领域里获得成功。并基于BlueField DPU服务场景发挥关键的灵魂作用,可以释放DPU的潜力。
英伟达网络技术专家崔岩先介绍了NVIDIA DOCA 的前几代软件版本的历史来源。
最早的DOCA 1.0是在2020年GTC秋季大会上,与BlueField-2 DPU一同发布的,后面持续演进到DOCA 1.1版本,更加完善了整个DOCA软件栈,提供了DOCA SDK、运行时、以及DOCA服务。到了DOCA1.2版本,也就是在1.3之前使用的版本,在这个版本上更加加强了在零信任分布式安全解决方案上的支持,直到我们这次5月份新发布的DOCA 1.3,它提供了121个新的API开发接口,也提供了一些全新和增强的功能,包括优化数据流插入的DOCA Flow库、通信通道库、正则表达式库、我们App ShieldSDK、基于OVN的IPSec加密的完全卸载,以及新增的一些DOCA服务,比如HBN,就是我们在DPU上实现了三层的路由功能。
从DOCA软件开发套件来看,它主要是为了来创建和构建应用程序所需的所有组件,包括驱动程序、抽象的API库、各种开发工具、参考源代码、示例程序和开发所需相关的文档,现在到了DOCA 1.3版本,它已经是比较完善的软件栈,开发者可以轻松地基于这个软件栈在本地 BlueField DPU 上或X86的开发容器中搭建开发环境,来快速地开发自己想要实现的应有程序或服务。
DOCA框架能够给开发者提供一个一致的开发体验,既可以统一访问BlueField DPU上各种硬件资源,从而简化网络存储安全和基础设施管理服务相关的开发,开发者也不用担心开发环境的构建和部署复杂程度,基本上DOCA是个即插即用的方式,可以让开发者很容易地来使用这个软件栈。
同时,还为开发者提供了基于底层API抽象封装的高级API库,这样对于开发者来讲,可以大大地节省他的开发时间,更早或更快地来使大的开发应用投入到市场,获得更大的投资收益。当然,DOCA还提供了相应的容器化的DOCA服务,可以在BlueField DPU上直接进行部署,来提供相应的应用和解决方案。客户不需要在DOCA服务上再做进一步的开发。
在线上分享会,专家崔岩特别着重介绍了三个DOCA 1.3上的新功能或增强功能。
图:NVIDIA DOCA 1.3的主要新功能介绍
第一个要介绍的是正则表达式库,这个正则表达式也称为Regular Expression(RegEx),是许多脚本语言使用标准模式匹配的工具,有了它可以创建与文本模式匹配的一些过滤器,而不仅是单个单词或短语的匹配。正则表达式是专为高吞吐量、低延时、深度包检测的应用程序而设计,这些应用程序需要数据包,可以进行负载 检测和异常监测,通过正则表达式模式匹配字符串来实现相应的应用功能。这个正则表达式还可以做一个安全遥测的功能,可以在DOCA1.3上更好地提供一些安全方面的应用,比如应用识别、入侵防御的系统、URL的过滤、文件的扫描、深度数据包检测,以及App Shield的内存扫描。这些都会用到正则表达式库的相应功能,能为这些安全软件开发提供底层的API支持。
第二个需要强调的或者需要介绍的,是我们基于OVN的数据路径加密功能。在我们之前的1.2版本能将主机内的IPsec相应的功能卸载到DPU之上,构建IPsec的控制平面,在vSwitch控制平面上实现IPsec加密和解密。新的增强版本上,我们把这个功能相当于扩展到整个OVN范畴之内,不同主机之间都可以用这个IPsec的方式来创建不同的通道,进行数据的加密,保证数据在不同主机之间传递的时候,它是一个加密的状态。当这个数据达到某个主机时,DPU会把它解密成明文,把这些明文数据再传递给主机侧来为业务应用提供数据。这是OVN数据路径加密的,在DOCA1.3上的一个新增功能。
最后一个要介绍的是DOCA基于主机的网络,我们简称为“HBN”。这个功能是在NVIDIA BlueField DPU上基于主机的网络上可以进行管理和监控同一节点上虚拟机和容器之间的流量,也就是说我们在一个服务器主机上可能创建了多个虚拟机或多个容器,在它们之间会有一些数据流量,不仅是转发二层数据流量,还要实现三层路由功能,我们也把它实现在了BlueField的DPU之上,通过基于主机网络的DOCA服务。而且它还可以做加密和解密,进行节点流量的监控,同时也会把一些原来是依赖以TOR交换机上面的功能也在DPU上面得到了实现,这种方式会彻底改变客户构建和思考整个数据中心网络构建的方式。
随着BlueField DPU智能化程度的提高,在整个网络里把功能都会集中在BlueField DPU之上去做相应的实现,这样就会降低对TOR交换机的相关要求,BlueField DPU还可以提供一个隔离的环境,这样可以做更好的安全性的部署。
归根到底,基于主机的网络HBN它是一个DOCA的服务,像我前面介绍的那样,它实际不需要客户再在上面做过多的开发,直接就可以通过容器的方式可以直接在BlueField DPU上面做部署,通过作为BGP的路由器来使用,可以做主机内的虚拟机或容器之间的三层数据转发路由,也可以对主机外相应的其他节点上的数据进行三层转发,使二层网络和三层网络都得以扩展。当然,也会扩展到云计算里多租户的环境之下。
在整个BlueField DPU上实现了这些动态的路由协议之后,可以大大地加速整个网络数据流量处理性能,同时BlueField DPU还可以提供相应的安全保障,这是HBN会给BlueField DPU和未来客户在数据中心网络部署的时候会带来全新的方式。
分享会上首届NVIDIA DPU中国黑客松亚军团队、优秀开发者代表胡效赫也很高兴地分享了他及其团队使用DOCA的开发经验与心得。
胡效赫是一位来自高校的DPU开发者,其黑客松参赛团队是由一位博士后和两位博士生组成的,研究方向是云计算和分布式系统。“从2020年NVIDIA发布BlueField DPU开始,我们就在关注相关的学术界和业界的信息。今年通过微信上的活动推送,我们得知并有机会参与了首届NVIDIA DPU中国黑客松,并获得了亚军。”
在开发过程中通过专家的指导充分地了解了DPU的硬件特性,DOCA良好的可编程性让开发者可以快速实现并验证创新的想法。同时开发者也可以对DOCA的API进行深度、定制化开发,实现更好的性能和更丰富的功能。
胡效赫介绍说:“我们开发团队提出了DeepTrace项目,面向DPU驱动的基础设施的网包级函数粒度业务可观测性。我们以DOCA提供的网流及粗粒度可观测性为基础,对应的是DOCA中的Netflow API库,结合DPU的高性能网络处理功能,对应的是DPU的ASAP2网包分类引擎,以及DOCA中的Flow API库,以及数据平面和控制平面的可编程能力,将可观测性的力度提升至网包级,并精确到每个函数功能。同时,我们也做到了几乎可以忽略不计的性能损耗。”
“通过DOCA和项目开发来具体介绍我们是如何创新地设计DeepTrace项目的。业务流量首先经过DeepTrace预选器,再经由原始的GPU程序进行处理,在DPU程序中会调用DeepTrace的触发器来实现相应点位的观测,然后被观测的数据会被汇总收集至分析器,通过数据的重组和分析得到相应的结果,比如得到异常流量的检测以及业务问题的定位等。基于DOCA开发DeepTrace的整体编程模式和在CPU上进行DPDK网络功能的开发功能类似,这种模式提高了我们的开发效率。”
“具体来看,其中触发器部分的挑战是如何以最小的代价收集链式函数和网包的信息,我们采用的方案是以统一化、轻量化的函数内触发器实现,具体在开发过程中,我们将DOCA的NetFlow库修改为网包粒度,而需要观测的函数以API的形式调用触发器即可。”
“在预选器部分的挑战是如何处理大规模原始流量,并在函数链中记录网包。我们采用的方案是通过硬件卸载的预选器进行标记和过滤。具体在开发过程中我们调用DOCA的Flow库配置所需预选的颗粒规则即可实现,因为预选功能实际由硬件卸载完成。所以,方案带来的性能损耗几乎可以忽略不计划。在分析器部分,我们由运行在ARM控制平面的开源开放工程实现。”
对于DOCA开发者免费使用卓越中心的DOCA开发环境的开放时间和规则,主办方也在线上作了解释。具体可以参考以下的两张PPT截图,供NVIDIA的DPU开发者参考。
卓越中心的运营方仍然还是之前所授权的两家公司:丽台信息和信弘智能科技。
NVIDIA网络与AI产品的最新进展,元宇宙最火的硬件平台原来是它!
NVIDIA网络市场总监孟庆也在分享会上顺便介绍了一下公司网络产品最新进展,包括在众多开源联盟参与标准建设、开放网络软件等方面的进展,以及NVIDIA成为Linux基金会OPI项目创始成员等。
也提到了NVIDIA在全球Top 500超级计算机互连中占主导地位的成就,如上图所示。有197个 Top 500强系统中采用了NVIDIA InfiniBand 网络。
孟庆还介绍了Spectrum-4 400Gbps 端到端以太网平台,其中包括 Spectrum-4 交换机、ConnectX-7智能网卡、BlueField-3 DPU及相关软件可以有力支撑炙手可热的元宇宙(Omniverse)。“在数字孪生里,Omniverse标准的OVX SuperPod,我们采用的方案必须得是Spectrum-4 400G这套网络平台这样才能更好的实现您所需的数字孪生,由数字人-数字机器-物理世界做相应的互联”孟庆说。
原文标题:NVIDIA DOCA 1.3版本发布 元宇宙最火开发利器现身
文章出处:【微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。
全部0条评论
快来发表一下你的评论吧 !