Arm在处理器的“江湖”又掀起一阵新的“性能风暴”

胡薇 发表于 2018-07-10 14:11:31 收藏 已收藏
赞(0) •  评论(0

Arm在处理器的“江湖”又掀起一阵新的“性能风暴”

胡薇 发表于 2018-07-10 14:11:31

截止到2017年12月份,Arm的合作伙伴总计出货了1200亿台基于Arm的设备,基于Arm的片上集成系统(SoC)仅2017年便出货213亿,占总体市场份额的39%。Arm一路见证和参与了科技世界的巨变,并且仍在不断前进。

发布《物联网安全宣言》,同时在此基础上宣布推出业界首个通用安全框架——平台安全架构(PSA)。

推出Project Trillium项目,这是一套包括新的高度可扩展处理器的Arm IP组合,可以提供增强的机器学习(ML)和神经网络(NN)功能。

发布包含全新的视频、显示和图像处理器的Mali多媒体套件,可与基于DynamIQ的CPU和其他Arm IP无缝集成,从而全面实现新一代针对主流移动设备和数字电视的解决方案。

Cortex-M35P,通过授权SoC设计人员将更高级别的安全性纳入到日益增长的一系列需要抵御物理攻击威胁的应用。

是的,Arm创新的步伐从未停止,尤其是在移动产业上,也进一步带动了其他行业的增长。这不,最近发布的三款新品,在处理器的“江湖”又掀起一阵新的“性能风暴”。

Cortex-A76

基于DynamIQ技术的全新高性能CPU Cortex-A76震撼登场,移动处理器领域一直是Arm CPU的强项,新一代“性能担当”Cortex-A76又将如何以移动级的效率实现笔记本级的性能呢?

移动级的效率,笔记本电脑级的性能

1、与Cortex-A75相比,Cortex-A76实现了35%的性能提升。

2、功耗降低了40%。

3、Cortex-A76能发挥比前一代产品高达4倍的终端机器学习性能。

强劲性能背后的“小秘密”

Cortex-A76在微架构方面几项重大改进包括提升每周期处理指令数量,和更深度的内存层级平行处理,达到更高的性能。

其中一些关键改进包括:

解耦合分支预测(Decoupled branch prediction)与指令预取(instruction fetch):设计在高带宽下隐藏延迟,Cortex-A76前端顺序取指组件每个周期能预取4至8个指令,并使用多层式分支目标快取缓存(multi-level branch target caches)以及混合式间接预测器(hybrid indirect predictor)来维持最高的处理量。

译码宽度更大:Cortex-A76是Arm首款采4译码宽度核心,每周期处理指令的最大数量进一步增加。每周期高达8个处理作业可分派到乱序执行(out-of-order)核心,支持更宽的空间与功耗优化指令窗口。

更高的整数与向量执行处理量:四指令管线(Quad-isue)整数处理单元内建于核心中,包含3个简单ALU以及1个多周期整数处理组件。此外,Cortex-A76支持双指令管线原生式16B(128位)向量与浮点运算单元,其处理量是所有先前此代Arm CPU的两倍。最重要的是,它提供如先前所述提高4倍的机器学习性能。

强化内存系统:登个缓存构架除了针对延迟与带宽进行协同优化,还配备精密的第四代预取器(prefetcher),以及深度内存并行处理功能。

Mali-G76

作为Mali GPU家族的“新晋生力军”,采用Bifrost架构,Mali-G76是如何再度将GPU性能提升至前所未有的高度呢?

如何满足高品质用户体验的视觉需求?

1、高清手游的巨大市场以及带来庞大收入的强力推动。

2、VR/AR等新一代高品质侵入式应用的迫切需求。

3、移动设备端也越来越有必要的机器学习能力。

视觉影像的全新境界

1、从高拟真动作游戏到混合现实(MR),Mali-G76提升了30%的性能密度,以及30%的能源效率。

2、Mali-G76在机器学习上的表现是Mali-G72的2.7倍。

这些改进让画面更“逼真”

1、Mali-G76支持int8 dot,配备双材质贴图对映器(texture mapper),优化缓存器,使用数量减半但容量较大的缓存器库区(bank)。

2、在Mali-G76里尽早配置区块深度缓冲区空间,以便及早执行深度预载,能在算出法向片元(normal fragment)之前完成,因此避免相依延迟的状况,进而增进GPU在处理复杂内容时的性能。

3、Mali-G76建置了TLS地址交插(address interleaving),让单线程的数据能集中配置在快取中的相同位置,与以往将数据少量散布在多个位置不同,从单一位置检索数据不仅更有效率,还能改进整体运算性能。

Mali-V76

如果想要获取不一样的高清视觉体验,除了高性能的GPU外,你还需要Mali-V76这样的“解码大师”。作为Arm最新最强的高端视频处理器,实时呈现高性能 UHD 8k60fps 的内容小case啦。

视频处理哪家强?

1、支持8K60帧的视频解码,Mali-V76的速度是Mali-V61的两倍。

2、提供同样解码能力的同时,它实现了40%的面积节省。

3、跟Mail-V61视频编解码器的编码质量相比,在同样的内容、同样的条件下,可以带来25%的编码质量提升。

Arm是如何办到的?

1、在Mali-V76中加入额外的AXI总线,使处理量增加一倍。

2、把整个视频流水线的行缓冲区(line buffer)从4096个像素增加到8192个。

3、Mali-V76搭载了8K编码功能。

Arm全新计算和多媒体IP套件“从小屏到大屏”,从新定义移动设备!

收藏

相关话题
文章来源专栏
+关注

评论(0)

加载更多评论

参与评论

分享到

QQ空间 QQ好友 微博
取消