×

高效的C编程之C循环结构

消耗积分:1 | 格式:rar | 大小:0.2 MB | 2017-10-17

分享资料个

14.5 C循环结构
  循环体是程序设计与优化的重点考虑对象。本节将着重讲解在ARM上处理for和while循环最有效的方法。
  14.5.1 循环中止
  首先来看下面的例子,两个不同的循环退出条件,产生的不同汇编代码。
  C源程序如下所示。
  int fact1 (int n)
  {
  int i, fact = 1;
  for (i = 1; i 《= n; i++)
  fact *= i;
  return (fact);
  }
  int fact2 (int n)
  {
  int i, fact = 1;
  for (i = n; i != 0; i--)
  fact *= i;
  return (fact);
  }
  产生的汇编代码如下所示。
  fact1
  MOV a3,#1
  MOV a2,#1
  CMP a1,#1
  BLT |L000020.J5.fact1|
  |L000010.J4.fact1|
  MUL a3,a2,a3
  ADD a2,a2,#1
  CMP a2,a1
  BLE |L000010.J4.fact1|
  |L000020.J5.fact1|
  MOV a1,a3
  MOV pc,lr
  fact2
  MOVS a2,a1
  MOV a1,#1
  MOVEQ pc,lr
  |L000034.J4.fact2|
  MUL a1,a2,a1
  SUBS a2,a2,#1
  BNE |L000034.J4.fact2|
  MOV pc,lr
  从产生的汇编代码中,可以看出两个函数虽然实现的功能相同,但产生的代码效率却不尽相同。这里的关键是,循环的中止条件应为计数减到零(count down to zero),而不是计数增加到某个值。由于减计数结果已存储在条件标志里,与零比较的指令就可以省略。同时也可以少用一个寄存器来存储循环中止值。
  注意上面的例子使用了-O2 –Otime的编译选项,如果使用-Ospace选项,编译结果会有不同。
  对循环计数值i来说,如果i是无符号的,则循环继续的条件既可以是i!=0,也可以是i 》 0。由于i不可能是负数,所以这两个条件是等价的。而对一个有符号的循环计数值来说,最好不要用条件i 》 0作为循环继续执行的条件。如果使用i 》 0作为循环继续执行的条件,编译器将生成下面的代码。
  SUB a2,a2,#1
  CMP r1,#0
  BGT |L000034.J4.fact2|
  这时,编译器多增加了一条CMP指令,主要是为了防止有符号数i= −0x8000000。总之,无论对于有符号还是无符号的循环计数值,都应该使用i != 0作为循环的结束条件。对于有符号数i,这比使用i 》 0少了一条指令。
  14.5.2 循环展开
  在14.5.1节中可以发现,每次循环需要在循环体外加两条指令:一条减法指令来减少循环计数值和一条条件分支指令。通常这些指令称为循环开销(Loop Overhead)。在ARM7或ARM9处理器上,加法指令需要1个周期,条件分支指令需要3个周期,这样每个循环就需要4个周期的开销。
  可以通过展开循环体(Loop Unrolling),即重复循环主体多次,同时按同样的比例减少循环次数来降低循环开销。
  下面的例子通过将循环体展开4次,来达到减少循环开销的目的。
  int countbit1(uint n)
  { int bits = 0;
  while (n != 0)
  {
  if (n & 1) bits++;
  n 》》= 1;
  }
  return bits;
  }
  将循环主体展开。
  int countbit2(uint n)
  { int bits = 0;
  while (n != 0)
  {
  if (n & 1) bits++;
  if (n & 2) bits++;
  if (n & 4) bits++;
  if (n & 8) bits++;
  n 》》= 4;
  }
  return bits;
  }
  这里减少了4N的循环开销(N=4,即循环体执行的次数)。如果循环体中存在耗时的Store/Load指令,则代码执行效率的提高将更明显。
  ARM编译器不会自动将循环体展开,只有用户自己判断何时将循环体展开,到底应该展开多少次,如果循环的次数不是循环展开的倍数该怎么办?下面就将详细讨论,用户编写自己的循环展开程序时,需要注意的问题。
  ① 只有当循环展开对提高应用程序的整体性能非常重要时,才进行循环展开;否则反而会增加代码尺寸。
  ② 应设法使循环的次数是循环展开的倍数。如果难以实现,那么就要增加额外的代码来处理数组的剩余元素。这将增加少许代码量,但可以保持较好的性能。
 

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !