×

NEON的详细资料简介资料免费下载

消耗积分:1 | 格式:pdf | 大小:0.13 MB | 2019-04-23

从未拥有

分享资料个

  ARM ENON技术可加速多媒体和信号处理算法(如视频编码/解码、2D/3D图形、游戏、音频和语音处理、图像处理技术、电话和声音合成),其性能至少为ARMv5性能的3倍,为ARMv6 SIMD性能的2倍。NEON技术是ARM Cortex-A系列处理器的128位 SIMD架构扩展,旨在为消费性多媒体应用程序提供灵活、强大的加速功能。

  从ARMv7开始ARM提供高级单指令多数据(SIMD)扩展亦称NEON技术,它是一种由ARM开发的64/128位混合SIMD体系结构,可以提升多媒体和信号处理应用程序的性能。

  NEON的寄存器:有16个128位四字寄存器Q0-Q15,32个64位双字寄存器D0-D31,两个寄存器是重叠的,在使用的时候需要特别注意,不小心就会被覆盖掉。

  NEON的数据类型:无符号整数、有符号整数、未指定类型的整数、浮点数、{0,1}上的多项式。数据类型针对的是操作数,而不是目标数。NEON中的数据类型说明符由一个指示数据类型的字母构成,该字母通常后跟一个指示宽度的数字。

  NEON指令可处理:

  (1)、由以下内容构成的双字向量:八个8位元素、四个16位元素、两个32位元素、一个64位元素;

  (2)、由以下内容构成的四字向量:十六个8位元素、八个16位元素、四个32位元素、两个64位元素。

  NEON中的正常指令、宽指令、窄指令、饱和指令、长指令:

  (1)、正常指令:生成大小相同且类型通常与操作数向量相同的结果向量;

  (2)、长指令:对双字向量操作数执行运算,生成四字向量的结果。所生成的元素一般是操作数元素宽度的两倍,并属于同一类型;

  (3)、宽指令:一个双字向量操作数和一个四字向量操作数执行运算,生成四字向量结果。所生成的元素和第一个操作数的元素是第二个操作数元素宽度的两倍;

  (4)、窄指令:四字向量操作数执行运算,并生成双字向量结果,所生成的元素一般是操作数元素宽度的一半;(5)、饱和指令:当超过数据类型指定的范围则自动限制在该范围内。

  NEON标量:有些NEON指令可处理与向量组合使用的标量。NEON标量可以为8位、16位、32位或64位。除乘法指令之外,访问标量的指令也可访问寄存器组中的任何元素。指令语法通过在双字向量中使用索引来引用标量,从而使Dm[x]表示Dm中的第x个元素。乘法指令仅允许使用16位或32位标量,并且只能访问寄存器组中的前32个标量。这在乘法指令中意味着: (1)、16位标量限定为寄存器D0-D7,其中x位于范围0-3内;(2)、32位标量限定为寄存器D0-D15,其中x为0或1。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !