面向嵌入式应用的系列GPU

发表于 2019-06-16 10:00:50 收藏 已收藏
赞(0) •  评论(0

面向嵌入式应用的系列GPU

发表于 2019-06-16 10:00:50
+关注

介绍PowerVR-9XE系列,PowerVR-9XMP系列,以及PowerVR-9XTP系列 GPU

面向嵌入式应用的GPU的持续快速发展是不争的事实。随着PowerVR-9XE系列,PowerVR-9XMP系列,以及PowerVR-9XTP系列 GPU的推出,Imagination再次突破了图形和计算性能的极限。

这三个系列涵盖了入门级、中档和高端产品,代表了我们有史以来最好的产品线,通过优化和不断提升使得这些产品能够提供更出色的单位面积性能并保持低功耗。此外我们还推出了面向神经网络推理的PowerVR3NX加速器,还有全新的Ensigma定位IP,这也代表了我们在2019年全面的产品供应。

面向嵌入式应用的系列GPU

PowerVR Series9XEP:满足人们应用的需求

下面我们介绍一些更有意义的内容,先从入门级产品开始:PowerVR Series9XEP系列。这款IP是基于Rogue架构,主要面向对物理尺寸和成本(二者之一或全部)敏感的应用市场,像机顶盒和低端智能手机,这类产品会优先考虑流畅的呈现复杂且高分辨率的用户界面,而不是满足3D游戏的性能需求。当然这并不是说不能够在PowerVR 9XEP系列上运行游戏。相比去年的9XE系列,9XEP通过架构的调整使整体性能提升了10%。最重要的是优化后端设计使最高时钟频率提升了额外的10%。

面向嵌入式应用的系列GPU

面向嵌入式应用的系列GPU

Series9XEP系列一个关键的提升是支持PVRIC4,即我们在今年早些时候宣布的最新的图像压缩技术。这样做的好处是可以保证系统带宽和内存占用降低50%,同时这意味着SoC设计人员可以进一步降低设计难度,并且有助于减少功耗。当然我们所有新的Series9XEP系列的GPU器件中都支持这一特性。除了PVRIC4特性外,其他的设计改进和面积优化都确保了9XEP系列维持在XE族GPU中的领先地位。

面向嵌入式应用的系列GPU

PowerVR Series9XEP将会根据SoC设计人员的需求和面积、功耗预算来提供一系列的不同配置的IP核,可选范围覆盖1-8 pixel/clk以及16-64 flop/clk。

PowerVR Series9XMP:主导中端应用市场

同样是基于Rogue架构,PowerVR Series9XMP相比Series9XM的改进则更为显著,并且在性能密度方面特别的明显。比如一个具有双16通道的ALU和两个纹理处理单元(TPU)的部分现在可以用一个32通道的ALU和TPU来实现,从而显著降低了器件尺寸。总的来说Series9XMP在集群密度上提升了45%,采用更小的面积满足相同的性能,这在成本和功耗节省方面是非常有意义的。

面向嵌入式应用的系列GPU

图像质量也得到了很大的提升,通过增加专用的纹理缓存,获得了两倍的反向滤波性能提升。更强大的反向滤波性能意味着图像会变得更加的清晰,是游戏玩家更能够察觉到画质上的显著提升。

面向嵌入式应用的系列GPU

当然还有一些其他的改进,比如降低核心管理单元的开销和带宽,并将系统缓存的大小增加一倍,此外对于缓存、原子操作、数据控制的建立速率,计算负载和其它负载重叠方面也进行了改进,优化和加强了数据通路。

当然PVRIC4技术在这个系列中也是支持的,在配置方面Series9XMP更侧重于计算方面,在四像素/时钟的情况下能够提供128 FP32 ops/秒的操作性能。

这使它完美的适用于高性价比的中端游戏或AI设备,比如中端智能手机。

满足高端市场的顶级性能

对于高端的性能需求我们提供了PowerVR Series9XTP系列,它是基于更新型的Furian架构,相比Rogue架构有重大的改进,从而能够增强灵活性,提升性能上限,打破性能瓶颈,同时又更高的功效。大家可以访问我们关于Furian架构的博客,了解它能够给我们的影响,但是这里我想说Series9XTP在几个关键领域得到了进一步的增强。

我们快速回顾一下,Furian架构中着色器处理单元(SPU)包含两个统一的着色器集群(USC),在这些USC内部是重新设计的算术逻辑单元(ALU),这部分逻辑在GPU核心部分负责执行复杂的算术运算。与Series8XT系列一样,这个ALU单元的每条流水线可以在每个时钟内执行一个MAD和一个MUL操作,并且是首次采用32bit位宽的pipeline设计。

Series9XTP系列对两个方面进行了显著的增强,首先是可达40pipeline宽度的ALU单元,因此可以同时完成更多的工作。其次是每个SPU单元可以指定三个USC单元,具有更高的GLOPS参数。这一设计使得核心能够提供高达360 FP32 FLOPS/clock性能,并且填充率可达8PPC,完全可以满足高端市场的性能需求。两个SPU单元联合,性能可以双倍达到16PPC以及720 FP32 FLOPS/clock,从而实现一个性能非常强大但仍然是节能的核心。

Series9XTP系列进行了各方面的优化,比如缓存优化以及微架构的增强。相同面积下,PowerVR Series9XTP相比Series8XT速度提升了50%,并提供更高的FLOPS密度,和以及更好的Manhattan场景测试的表现。

面向嵌入式应用的系列GPU

面向嵌入式应用的系列GPU

PVRIC4技术带来的50%的系统带宽和内存占用的降低,为其他的优化手段创造了空间,使得PoverVR9XT系列相比于PoverVR8XT系列,可以进一步降低成本。

PowerVR Series9XTP系列继承了Series8XT系列所有的核心特性,比如支持所有最新的相关API,比如OpenGL ES 3.2和Vulkan 1.1。在Series9XEP和Series9XMP系列平台上同样支持我们开发的独特的硬件虚拟化技术,支持多个操作系统独立运行,而且保证相互间的隔离和数据安全,它们之间可以实现快速的上下文切换确保不会造成性能损失。

总结

第二代PowerVR Series9提供了一系列IP核,根据SoC设计人员的设计需求为他们提供广泛的选择。在给定的面积和功耗范围内能够实现填充率和浮点运算性能的完美平衡,无论是一款经济实惠的智能手机,还是可装入口袋的移动穿戴设备,或是车载娱乐系统,PowerVR-9系列GPU都可以覆盖您的设计需求。

声明:本文由入驻电子说专栏的作者撰写或者网上转载,观点仅代表作者本人,不代表电子发烧友网立场。如有侵权或者其他问题,请联系举报。侵权投诉

收藏

相关话题

评论(0)

加载更多评论

分享到

QQ空间 QQ好友 微博
取消