×

Thumb指令的特点及实现

消耗积分:1 | 格式:rar | 大小:0.8 MB | 2017-10-19

分享资料个

在ARM体系结构中,ARM指令集中的指令是32位指令,其执行效率很高。对于存储系统数据总线为16位的应用系统,ARM体系提供了Thumb指令集。Thumb指令集是ARM指令集的一个子集,它比ARM指令集有更高的代码密度(一个可执行的程序在内存中所占的空间)。在存储系统受限的嵌入式系统中,比如移动电话、PDA等,代码密度是非常重要的,同时,成本压力也会限制存储器的大小、数据宽度和速度。在ARM体系的T变种(T variable)的版本中,同时支持ARM指令集和Thumb指令集,而且遵循一定的调用规则时,Thumb子程序和ARM子程序可以相互调用。
  11.1 Thumb指令的特点及实现
  Thumb指令集把32位ARM指令集的一个子集编码为一个16位的指令集。在16位外部数据总线宽度下,ARM处理器上使用Thumb指令的性能要比使用ARM指令的性能更好;而在32位外部数据总线宽度下,使用Thumb指令的性能要比使用ARM指令的性能差。因此,Thumb指令多用于存储器受限的一些系统中。Thumb指令集并没有改变ARM系统底层的程序设计模型,只是在该模型上增加了一些限制条件。Thumb指令集中的数据处理指令的操作数仍然是32位,指令寻址地址也是32位的。
  代码密度是Thumb指令集的一个主要优势。平均而言,对于同一个程序,使用Thumb指令实现所需的存储空间,要比等效的ARM指令实现少30%左右。下面的例子代码,使用ARM指令和Thumb指令实现相同的除法操作。从例子中可以看出,虽然Thumb指令的实现使用了更多的指令,但是它占用的总的存储空间却比较小。
  【例11.1】使用ARM指令实现除法运算
  MOV r3,#0
  loop
  SUB r0,r0,r1
  ADDGE r3,r3,#1
  BGE loop
  ADD r2,r0,r1
  【例11.1】中r0为被除数,r1存放除数,r2和r3分别存放余数和商。完成整个除法运算使用了5条指令,每一条指令所占的字节数为4,所以实现一个除法运算,ARM指令所占有的字节数为20。
  【例11.2】使用Thumb指令实现除法运算
  MOV r3,#0
  loop
  ADD r3,#1
  SUB r0,r1
  BGE loop
  SUB r3,#1
  ADD r2,r0,r1
  【例11.2】使用Thumb指令完成了和【例11.1】完全相同的功能。Thumb指令虽然使用了6条指令,但其每条指令占用2个字节,所以总的字节数为6×2=12,小于ARM指令所占用的20个字节。
  Thumb指令是ARM指令的一个受限子集,在Thumb状态下,不能直接访问所有的处理器寄存器,只有r0~r7是可以被任意访问的,在Thumb状态下使用该8个寄存器和在ARM状态下使用没有区别。寄存器r8~r12只能通过MOV、ADD或CMP指令访问。CMP指令和所有操作r0~r7的数据处理指令都会影响CPSR中的条件标志位。一些Thumb指令还使用到了程序计数器PC(r15),链接地址寄存器LR(r14)和堆栈指针寄存器SP(r13)。在Thumb状态下,读取r15寄存器时,bit[0]值为0,bit [31∶1]包含了PC的值。当对r15进行写入时,bit[0]被忽略,bit[31∶1]被设置成当前程序计数器的值。
  表11.1列出了Thumb状态下,各寄存器的使用情况。
  表11.1 Thumb寄存器的使用
  寄 存 器访 问
  r0~r7完全访问
  r8~r12只能通过MOV、ADD及CMP访问
  r13限制访问
  r14限制访问
  r15限制访问
  CPSR间接访问
  SPSR不能访问
  从表11.1可以看出,Thumb状态下不能直接访问CPSR和SPSR。也就是没有和MSR和MRS等价的指令。为了改变CPSR和SPSR的值,必须使处理器状态切换到ARM状态,再使用指令MSR和MRS来实现。同样,在Thumb状态下也没有协处理器访问指令,要访问协处理器寄存器来配置cache和进行内存管理,也必须使处理器切换到ARM状态。
  注意Thumb状态下,对CPSR的条件标准位控制由算术和逻辑操作设置并控制条件转移。
 

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !