处理器/DSP
2016年初,随着AlphaGo大败围棋世界冠军李世石,人工智能概念大热,各类人工智能产品也迎来了爆发。众多的科技巨头也纷纷在人工智能领域投下了重注。根据国外调查机构Tractica的统计预测数字显示,到2024年人工智能的市场规模将达到406亿美元(约合人民币2700亿)。相比之下2015年人工智能市场规模仅为490亿元,而这也意味着整个人工智能市场将呈现出爆炸式增长。
面对这样一个巨大的市场需求,ARM也开始了行动。
来看这么一组数字:第一个500亿片出货用了22年,第二个500亿片只用了4年,下一个1000亿出货需要多长时间? ARM给出的答案是用5年时间,即到2022年。ARM新推出的DynamIQ微架构可谓有备而来,但到底有什么“魔力”,能让ARM放出1000亿片出货量的“豪言”?
ARM称DynamIQ将是下一代计算革命的开始,将重新定义计算,可以覆盖覆盖从端到云的安全、通用平台。将被广泛应用于汽车、家庭以及数不胜数的各种互联设备,这些设备所产生的数据会在云端或者设备端被用于机器学习,以实现更先进的人工智能,从而带来更自然、更直观的用户体验。
而本地端的智能化和云端的智能化的“走同”不同,各种流派各逞风骚,如英伟达的GPU、赛灵思的FPGA、英特尔的CPU+FPGA等。Nandan Nayampally对此分析说,云端服务器通常采用多芯片架构,比如通用处理器,再加上专门的AI引擎之类。但反观设备端,出于功耗还有成本的限制,一般都是SoC(片上系统),不仅需要超强性能、支持多种算法的CPU核,并且能与片上系统其他硬件加速器之间实现快速响应。
伴随着AI的风起云涌,本地端SoC的智能化程度亦须“水涨船高”,需要CPU核以及片上系统响应的“双重”提升助力。
“魔力”十足的DynamIQ
自2011年ARM big.LITTLE技术推出以来,它已经成为了目前运用非常广泛的多核架构技术。而全新推出的DynamIQ技术则是big.LITTLE技术的重要演进。
原有的big.LITTLE技术是将多个大核组成一个计算集群、多个小核组成另一个计算集群,然后进行协作运行。而全新的DynamIQ big.LITTLE将允许在单一计算集群上进行大小核配置,可以出现比如1+3、1+7、3+5等诸多类型(目前最多可以支持配置8核),将可配置性提升到了一个新的台阶。同时,DynamIQ big.LITTLE还可以对每一个处理器进行独立的频率控制以及开、关、休眠状态的控制,可以实现高效的、无缝的在不同任务间切换最合适的处理器。
此外,DynamIQ还对内存子系统进行了重新设计,可以对内存进行更细颗粒度的管理,实现更快的数据读取和全新的节能特性。
先攻下智能手机和企业级应用桥头堡
DynamIQ确实相比以前ARM核,可以说是全方位的“推陈出新”,这也显示了ARM的实力和决心,毕竟从“芯”开始知易行难。
而ARM的DynamIQ面临的挑战其实应是路线之争,是以ARM核的CPU为主处理器,还是GPU,其他加速器模块是以FPGA或是DSP为主,这有非常明显的技术差分性,市场最终垂青哪种还有待检验。此外,还需要工艺的支撑。业界知名专家莫大康表示,未来CPU的进步可能不会那么明显,尺寸缩小可能已快进入终止序列,尽管7纳米、5纳米等都可能,但成本高,只能少数特许的客户使用,因而应用量要足够大才能得以平衡支出。
尽管还面临诸多有形无形挑战,但AI已来,要做的仍是“全力拥抱”。Nandan Nayampally对其应用也十分乐观,他说,每一种新的技术一般来说都是率先被用在智能手机领域,因为这一领域对技术的需求较多,有推动因素。同时ARM也十分看好企业级市场应用,因其对性能的要求、内存的容量、I/O的高吞吐量有很高要求,而DynamIQ也奠定了多重技术的支撑,因而将率先在企业级市场应用。
对于未来的集群和核数,Nandan Nayampally认为,移动方面由于软件线程方面的局限,以及尺寸空间的受限,基本上8核的单一集群即已足够。但是,对于企业级应用,一般来说需要8到16或32核。
DynamIQ为什么适合人工智能?
ARM前面强调了DynamIQ技术将会被广泛的用于人工智能和机器学习领域,那么它在这些方面到底有何优势呢?
首先,全新的DynamIQ big.LITTLE架构就非常适合人工智能和机器学习的。以语音识别为例,当需要唤醒设备时,这个时候关键词激活设备,只需要启动一个小核就可完成,而随后的语音识别就会立刻需要性能更强的核心;如果是面部识别则可能设备一开始就需要更强的性能,而当识别完成后,工作则迁移至小核。不难看出,人工智能对于大小核之间的调配、无缝切换都要求很高,显然全新的DynamIQ big.LITTLE架构是非常适合的,将会为机器学习和人工智能应用带来更快的响应速度。
其次,DynamIQ还特别加入了针对人工智能的指令集和优化库,下一代ARMV8.2版本的指令集将支持神经网路卷积运算,可以极大的提升人工智能和机器学习的效率。
据ARM透露,针对人工智能和机器学习的全新处理器指令集在采用DynamIQ技术的Cortex-A系列处理器在优化应用后,可实现比基于现有的Cortex-A73的设备高50倍的人工智能性能,并最多可提升10倍CPU与SoC上指定硬件加速器之间的反应速度。
与此同时,DynamIQ还加入了针对目前现有的各种人工智能算法的接口支持。这也意味着原有的人工智能算法厂商也能够基于DynamIQ的芯片来进行产品设计。
此外,在人工智能与机器学习目前比较热门的应用领域——自动驾驶方面,DynamIQ技术也能够为ADAS解决方案带来更快的响应速度,并能增强安全性,确保合作伙伴能够设计ASIL-D合规系统,即使在故障情况下仍然能够安全运行。
以上这些特性都使得DynamIQ非常适用于人工智能与机器学习领域。不过需要注意的是,基于DynamIQ的SoC依然是通用型SoC,它并不会替专用型代人工智能和机器学习、芯片,它的优势在于拥有更加广泛的和更加灵活的适用性,可以适用于更多类型的市场。同时它也可以与专用型芯片结合起来应用。
ARM在北京发布DynamIQ的算盘
为什么选在北京发布?
这个自然是跟客户有关,目前中国半导体市场已经占据全球半导体市场近乎2/3的市场,而且中国大陆IC设计业蓬勃发展,IC设计公司数量超过1400家,这比全球其他地区IC设计公司总数还多!此外,IC Insights数据显示,大陆地区纯IC设计业者合计销售额占比已由2010年的5%,大幅攀升为2016年的10%。2009年大陆仅有深圳海思半导体一家业者名列全球前50大纯IC设计业者之列。但2016年名列前50大的大陆业者,已有包括如海思、展讯、中兴微电子等11家公司了!
对比大陆纯IC设计公司的显著成长,目前美国业者销售额占比是53%但比2010年的69%已经大幅下滑了16个百分点(主要是受到博通被安华高收购的影响)。而欧洲地区由于CSR、Lantiq和NXP的收购,占比由2010年的4%下滑为2016年的1%!目前欧洲地区名列全球前50大纯IC设计业者仅剩英国Dialog一家。
日本地区主要纯IC设计业者也仅剩MegaChips一家。虽然2016年该公司销售额年增20%,但整体日本地区业者销售额占比,还是由2010年的1%,下滑为不到1%。
另根据“中国半导体行业协会”(CSIA)与“***半导体产业协会”(TSIA)最新数据,2016年大陆IC设计业销售额为人民币1,644.3亿元(约合239.1亿美元),已高于同期***IC设计业整体产值的新台币6,531亿元(约合202.1亿美元)。
抓住中国客户是根本,这也是在中国首发新技术的主因。
全部0条评论
快来发表一下你的评论吧 !