将互联网技术搬到芯片内部

TechSugar 发表于 2018-06-23 09:14:04 收藏 已收藏
赞(1) •  评论(0

将互联网技术搬到芯片内部

TechSugar 发表于 2018-06-23 09:14:04

当前信息技术的一个主要矛盾,是急剧增长的数据流与有限带宽之间的矛盾,伴随人工智能与5G技术发展,数据洪流时代将逐渐到来。据英特尔公司估算,在当下智能手机时代,每人平均产生的数据量约为1.5GB每天,而以后的人工智能物联网时代,一家智能医院每天产生3,000 GB(3TB)的数据量,一辆无人驾驶汽车每天产生4TB的数据量,一家智能制造工厂每天将产生1,000 TB的数据量。

急剧增长的数据量在改变人类生活方式的同时,也在深刻影响着技术走势。高速接口、5G拓宽了系统之间的数据通道,但系统内部互连,特别是芯片内部互连,也需要创新的方式来实现更高带宽。像自动驾驶这样的应用,不仅需要高带宽,还要保证信息传递的实时性与有效性,即要保证极佳的信息服务质量(QoS),“自动驾驶商用化,是人类第一次把身家性命大规模交给半导体来决断,芯片内部互连将至关重要,设计师需要保证信号回路没有任何阻断,延迟满足系统要求。”

NetSpeed Systems(以下简称NetSpeed)大中华区销售总监黄啓弘对TechSugar表示。

将互联网技术搬到芯片内部去

支持高水平自动驾驶功能的芯片均异常复杂,以Nvidia(英伟达)为例,其首款自动驾驶片上系统(SoC)Xavier集成了一个特别定制的8核CPU、一个512核Volta GPU、一个全新深度学习加速器、全新计算机视觉加速器、以及全新8K HDR视频处理器,该芯片共集成超90亿个晶体管,Nvidia投入2000多名工程师在这个项目上,总研发时间超过4年,总研发费用高达20亿美元。

20亿美元8000个工程年,是不是自动驾驶芯片都这样高不可攀?当然不是,Mobileye、特斯拉以及中国的地平线机器人等公司,都在发展自动驾驶用SoC芯片,根据各自对自动驾驶的理解,系统复杂度会有较大区别,再利用成熟的IP与工具,研发成本与时间预算与Xavier相比可能会有数量级的差异。

以特斯拉的自动驾驶芯片为例,据黄启弘介绍,从设计到流片只花了不到一年时间,NetSpeed相关解决方案力助特斯拉缩短研发周期,快速完成设计迭代。

当一颗芯片集成数百甚至上千个运算单元时,内部互连如何实现成为架构工程师与设计工程师面临的最严峻考验之一,传统总线架构已经变成系统性能的主要瓶颈。总线架构适合简单架构,但如果单芯片集成处理器核数越多,需要连接互通的模块越多,总线架构在性能、功耗、全局时钟同步、信号完整性及可靠性等方面面临的挑战将呈指数型增长。

NetSpeed Systems大中华区销售总监黄啓弘

“能否不要用总线理论,把所有数据用桥接模块分成数据包,用互联网的方法分发出去,”黄啓弘将这种片上网络(NoC)理念形象地比喻成在芯片上布一个互联网。

片上网络采用数据路由和分组交换技术替代传统总线结构,从体系结构上解决了传统总线结构由于地址空间有限导致的可扩展性差,分时通讯引起的通讯效率低下,以及全局时钟同步引起的功耗和面积较大等问题。

与传统的总线互连技术相比,NetSpeed的解决方案解除了总线架构带来的数据吞吐量限制,片内带宽可支持到万亿字节每秒(TB/s),接口位宽高达1024位 ,并可定制更高位宽。总线结构需要针对不同的系统需求单独进行设计,当系统功能扩展时,需要对现有设计方案重新设计,研发成本与设计周期均比较长,NetSpeed的解决方案采用分层堆叠方式将网络架构解耦,具有良好的可扩展性。当SoC片内网络中节点数量增加时,仅需要按照相应拓扑结构规则继续增大网络规模即可,缩短了产品的设计周期,节约了研发成本。另外,传统总线架构,每次信息交互都需要驱动全局互连线,因此总线结构所消耗的功耗将随SoC规模增加而显著增加,而NetSpeed方案中,可以将一部分信号通路关掉,从而实现低功耗。

为什么是NetSpeed?

NetSpeed成立于2011年,到现在规模并不大,在半导体行业资历颇深的黄啓弘为何要选择加入NetSpeed?用他自己的话来说,就是NetSpeed显示了增长的潜力,过去几年营业额都是100%以上的速度增长,也具备了成功的要素,“一家初创企业能否成功,主要看两点,第一是高管团队,第二是时机,能否在合适的时间,为市场上一个普遍难解的问题,提出合适的解决方案。”

NetSpeed核心技术团队来自思科与华为,这是他们能够将宏观世界的网络拓扑思想映射到芯片内部的基础。而人工智能应用爆发带来的数据洪流,让SoC的计算单元数量暴涨,对SoC内部带宽需求急剧增加,这正是黄啓弘所说的时机,在这个时间点上,NetSpeed解决方案为众多专注人工智能芯片设计的公司所重视,NetSpeed首席执行官Sundari Mitra表示:“这些新SoC内部体现出的是一种新的数据流,一般来说,想实现快速有效的点对点数据交换,就需要大量的计算单元。传统架构运行方式不同,采用中央存储作为数据交换系统。而人工智能系统需要任意位置数据交换,这可以通过广泛的接口而实现,并需要支持长突发传输。Orion AI的一个关键优势就是能够支持多重多播请求,并支持非阻塞传输。”

Orion AI由NetSpeed的图灵机器学习引擎提供支持,该引擎使用监督学习来探索和优化SoC设计与架构,为优化对自动驾驶应用的支持,Orion AI通过了ISO 26262标准,可支持ASIL D级别安全要求。

除了这次发布的Orion AI,NetSpeed还提供其他互连和高速缓存IP,以及设计开发工具NoCStudio。利用NoCStudio,SoC 开发人员可快速、高效、可靠地生成高度定制化的解决方案,NoCStudio输出的模块具有无死锁、缓存一致性以及确保服务质量的特性。

下一步计划

人工智能应用在中美都是热点,在NetSpeed列出的四家重要客户中,有三家是中国公司。除了自动驾驶,在云计算、AR、VR等方面NetSpeed都有布局,NetSpeed也在与手机芯片公司展开合作。

“到了5G之后,数据量非常大,数据交换的负担非常繁重。在NetSpeed看来,这也是在一个合适的时间点,进入一个合适的市场,因为下一代手机芯片的设计复杂度,一定是数量级上的飞跃,在这种情况下,工程师可能必须利用人工智能的方法,才能把设计做出来,在这方面,NetSpeed有优势。”

除了拓展中国市场及团队,黄啓弘表示,NetSpeed还在开发芯片间互连技术,以及进一步提升现有产品的性能,他最后强调,IP公司必须要以技术为本,NetSpeed成立8年以来,已经申请了130多项专利,技术实力逐渐得到了用户的认可,“作为一家正在成长的IP公司,技术要有足够的优势,最重要是得到用户认可。”

赞(1)

收藏

相关话题
文章来源专栏
+关注

评论(0)

加载更多评论

参与评论

相关文章

分享到

QQ空间 QQ好友 微博
取消