高效的C编程之寄存器分配

消耗积分:1 | 格式:rar | 大小:0.5 MB | 2017-10-17

分享资料个

14.7 寄存器分配
　　编译器一项很重要的优化功能就是对寄存器的分配。与分配在寄存器中的变量相比，分配到内存的变量访问要慢得多。所以如何将尽可能多的变量分配到寄存器，是编程时应该重点考虑的问题。
　　注意当使用-g或-dubug选项编译程序时，为了确保调试信息的完整性，寄存器分配的效率比不使用-g或-dubug选项低很多。
　　14.7.1 变量寄存器分配
　　一般情况下，编译器会对C函数中的每一个局部变量分配一个寄存器。如果多个局部变量不会交迭使用，那么编译器会对它们分配同一个寄存器。当局部变量多于可用的寄存器时，编译器会把多余的变量存储到堆栈。这些被写入堆栈需要访问存储器的变量被称为溢出（Spilled）变量。
　　为了提高程序的执行效率：
　　· 使溢出变量的数量最少；
　　· 确保最重要的和经常用到的变量被分配在寄存器中。
　　可以被分配到寄存器的变量包括：
　　· 程序中的局部变量；
　　· 调用子程序时传递的参数；
　　· 与地址无关变量。
　　另外，在一些特定条件下，结构体中的域也可以被分配到寄存器中。
　　表14.1显示了当C编译器采用ARM－Thumb过程调用标准时，内部寄存器的编号、名字和分配方法。
　　表14.1 C编译器寄存器用法
　　寄存器编号可选寄存器名特殊寄存器名寄存器用法
　　r0a1函数调用时的参数寄存器，用来存放前4个函数参数和存放返回值。在函数内如果将这些寄存器用作其他用途，将破坏其值。
　　r1a2
　　r2a3
　　r3a4
　　r4v1通用变量寄存器
　　r5v2
　　r6v3
　　r7v4
　　r8v5
　　r9v6或SB或TR平台寄存器，不同的平台对该寄存器的定义不同
　　r10v7通用变量寄存器。在使用堆栈边界检测的情况下，r10保存堆栈边界的地址
　　r11v8通用变量寄存器。
　　r12IP临时过渡寄存器，函数调用时会破坏其中的值
　　r13SP堆栈指针
　　r14LR链接寄存器
　　r15PC程序计数器
　　从表14.1可以看出，编译器可以分配14个变量到寄存器而不会发生溢出。但有些寄存器编译器会有特殊用途（如r12），所以在编写程序时应尽量限制变量的数目，使函数内部最多使用12个寄存器。
　　注意在C语言中，可以使用关键词register给指定变量分配专用寄存器。但不同的编译器对该关键词的处理可能不同，使用时要查阅相关手册。
　　14.7.2 指针别名
　　C语言中的指针变量可以给编程带来很大的方便。但使用指针变量时要特别小心，它很可能使程序的执行效率下降。在一个函数中，编译器通常不知道是否有2个或2个以上的指针指向同一个地址对象。所以编译器认为，对任何一个指针的写入都将会影响从任何其他指针的读出，但这样会明显降低代码执行的效率。这就是著名的“寄存器别名（Pointer Aliasing）”问题。
　　注意一些编译器提供了“忽略指针别名”选项，但这可能给程序带来潜在的bug。ARM编译器是遵循ANSI/ISO标准的编译器，不提供该选项。
　　1．局部变量指针别名问题
　　通常情况下，编译器会试图对C函数中的每一个局部变量分配一个寄存器。但当局部变量是指向内存地址的指针时，情况有所不同。先来看一个简单的例子。
　　void add（int * i）
　　{
　　int total1=0，total2=0;
　　total1+= *i;
　　total2+= *i;
　　}
　　编译后生成：
　　add：
　　0000807C E3A01000 MOV r1，#0
　　》》》 POINTALIAS\#3 int total1=0，total2=0;
　　00008080 E3A02000 MOV r2，#0
　　》》》 POINTALIAS\#5 total1+= *i;
　　00008084 E5903000 LDR r3，［r0，#0］
　　00008088 E0831001 ADD r1，r3，r1
　　》》》 POINTALIAS\#6 total2+= *i;
　　0000808C E5903000 LDR r3，［r0，#0］
　　00008090 E0832002 ADD r2，r3，r2
　　》》》 POINTALIAS\#8 }
　　00008094 E12FFF1E BX r14
　　》》》 POINTALIAS\#11 {
　　注意程序中i的值被装载了两次。因为编译器不能确定指针*i是否有别名存在，这就使得编译器不得不增加一条额外的Load指令。
　　另一个问题，当在函数中要获得局部变量地址时，这个变量就被一个指针所对应，就可能与其他指针产生别名。为了防止别名发生，在每次对变量操作时，编译器就会从堆栈中重新读入数据。考虑下面的例子程序，分析其产生的编译结果。
　　void f（int *a）;
　　int g（int a）;
　　int test1（int i）
　　{ f（&i）;
　　/* now use ’i’ extensively */
　　i += g（i）;
　　i += g（i）;
　　return i;
　　}
　　编译结果如下所示。
　　test1
　　STMDB sp！，{a1，lr}
　　MOV a1，sp
　　BL f
　　LDR a1，［sp，#0］
　　BL g
　　LDR a2，［sp，#0］
　　ADD a1，a1，a2
　　STR a1，［sp，#0］
　　BL g
　　LDR a2，［sp，#0］
　　ADD a1，a1，a2
　　ADD sp，sp，#4
　　LDMIA sp！，{pc}
　　从上面代码的编译结果可以看出，对每一次i操作，编译器都将会从堆栈中读出其值。这是因为，一旦在函数中出现对i的取值操作，编译器就会担心别名问题。为了避免这种情况，尽量不要在程序中使用局部变量地址。如果必须这么做，那么可以在使用之前先把局部变量的值复制到另外一个局部变量中。下面的程序是对test1函数的优化。
　　int test2（int i）
　　{
　　int dummy = i;
　　f（&dummy）;
　　i = dummy;
　　/* now use ’i’ extensively */
　　i += g（i）;
　　i += g（i）;
　　return i;
　　}
　　编译后的结果如下。
　　test2
　　STMDB sp！，{v1，lr}
　　STR a1，［sp，#-4］！
　　MOV a1，sp
　　BL f
　　LDR v1，［sp，#0］
　　MOV a1，v1
　　BL g
　　ADD v1，a1，v1
　　MOV a1，v1
　　BL g
　　ADD a1，a1，v1
　　ADD sp，sp，#4
　　LDMIA sp！，{v1，pc}
　　从编译结果可以看出，修改后的代码只使用了2次内存访问，而test1为4次内存访问。
　　总上所述，为了在程序中避免指针别名，应该做到：
　　· 避免使用局部变量地址；
　　· 如果程序中出现多次对同一指针的访问，应先将其值取出并保存到临时变量中。
　　2．全局变量
　　通常情况下，编译器不会为全局变量分配寄存器。这样在程序中使用全局变量，很可能带来内存访问上的开销。所有尽量避免在循环体内使用全局变量，以减少对内存的访问次数。
　　如果在一段程序体内大量使用了同一个全局变量，建议在使用前先将其拷贝到一个局部的临时变量中，当完成对它的全部操作后，再将其写回到内存。
　　比较下面两个完成同样功能的函数，分析全局变量的操作对程序性能的影响。
　　int f（void）;
　　int g（void）;
　　int errs;
　　void test1（void）
　　{
　　errs += f（）;
　　errs += g（）;
　　}
　　void test2（void）
　　{
　　int localerrs = errs;
　　localerrs += f（）;
　　localerrs += g（）;
　　errs = localerrs;
　　}
　　编译结果如下。
　　test1
　　STMDB sp！，{v1，lr}
　　BL f
　　LDR v1，［pc， #L00002c-。-8］
　　LDR a2，［v1，#0］
　　ADD a1，a1，a2
　　STR a1，［v1，#0］
　　BL g
　　LDR a2，［v1，#0］
　　ADD a1，a1，a2
　　STR a1，［v1，#0］
　　LDMIA sp！，{v1，pc}
　　L00002c
　　DCD |x$dataseg|
　　test2
　　STMDB sp！，{v1，v2，lr}
　　LDR v1，［pc， #L00002c-。-8］
　　LDR v2，［v1，#0］
　　BL f
　　ADD v2，a1，v2
　　BL g
　　ADD a1，a1，v2
　　STR a1，［v1，#0］
　　LDMIA sp！，{v1，v2，pc}
　　从编译的结果中可以看出，test1中每次对全局变量errs的访问都会使用耗时的Load/Store指令；而test2只使用了一次内存访问指令。这对提高程序的整体性能有很大帮助。
　　3．指针链
　　指针链（Pointer Chains）常被用来访问结构体内部变量。下面的例子显示了一个典型的指针链的使用。
　　typedef struct { int x， y， z; } Point3;
　　typedef struct { Point3 *pos， *direction; } Object;
　　void InitPos1（Object *p）
　　{
　　p-》pos-》x = 0;
　　p-》pos-》y = 0;
　　p-》pos-》z = 0;
　　}
　　上面的代码每次使用“p-》pos”时都会对变量重新取值。为了提高代码效率，将程序改写如下。
　　void InitPos2（Object *p）
　　{
　　Point3 *pos = p-》pos;
　　pos-》x = 0;
　　pos-》y = 0;
　　pos-》z = 0;
　　}
　　经过改写的代码，减少了内存访问次数，提高程序的执行效率，另外也可以在object结构体中增加一个point3域，专门作为指向p-》pos的指针。

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

AU6815P 内置 DSP 的 2×32W 立体声 I2S数字输入D类功放芯片中文资料
2026-04-27 3次下载

下载
A-29回音消除模块
2026-05-07 2次下载

下载
PC4139 32V低噪音大电流白光LED恒流驱动器数据手册
2026-04-27 2次下载

下载
双麦阵列回音消除及降噪模块 A-47 说明书
2026-05-07 2次下载

下载
人形机器人执行、感知系统技术及市场解析
2026-05-20 2次下载

下载
WD8002D产品规格书
2026-04-27 1次下载

下载

高效的C编程之寄存器分配

VersaClock 6 系列寄存器描述和编程指南

VersaClock 6 系列寄存器描述和编程指南

IO方向寄存器语句生成器资料下载

配置STM32寄存器控制GPIO点亮LED

STM32的寄存器操作

C语言：寄存器操作

寄存器与静态库

STM32学习笔记（2）——寄存器

GPIO寄存器

STM32寄存器实现流水灯效果

STM32寄存器实现流水灯效果

MPU6050寄存器介绍

STM8 寄存器点亮LED

32单片机 C语言 寄存器（四）

C语言访问MCU寄存器

LabViEW编程之VI服务器综述

寄存器功能码

GC1064寄存器配置参考文件下载

寄存器方式控制LED闪烁课件下载

FPGA中IOB寄存器的使用心得

AD转换寄存器设置

LabVIEW初级教程之循环中的数据操作隧道和移位寄存器示例程序

51单片机的特殊功能寄存器SBUF应该如何使用详细方法代码说明

51单片机的寄存器组应该如何设置

51单片机的21个特殊功能寄存器的详细资料说明

51单片机的一些特殊寄存器资料说明

51单片机特殊功能寄存器在C51程序中的定义详细说明

如何转移目的地址在机器码或寄存器中详细编程免费下载

寄存器的名称和地址的映射详细资料分析

如何进行寄存器名称和地址的映射分析

Atmel SAMC21的I2C驱动寄存器操作和寄存器代码免费下载

寄存器寻址的实现方式

寄存器分为基本寄存器和什么两种

CPU的6个主要寄存器

labview读取三菱plc寄存器内容

寄存器开发，HAL开发和LL开发的区别和参考代码

CPSR寄存器和APSR寄存器的组成

寄存器是什么？怎么操作寄存器点亮LED灯？

寄存器是什么 掌握使用寄存器做设计需要注意的事项

RAL寄存器模型操作指南

单片机的寄存器编程与位运算

深入理解ARM寄存器

怎么给D寄存器输入数值 三菱plc寄存器D怎么读取

浅析寄存器的作用及应用

单片机工作寄存器作用 单片机常用专用寄存器

16位寄存器数据范围 32位寄存器数据范围 数据寄存器多少位怎么算

什么是编译器算法之寄存器分配

寄存器的工作原理

简述RAL寄存器模型基础

什么是寄存器

ARM通用寄存器及状态寄存器详解

C语言操作寄存器的操作代码

解析CPU中的寄存器

不同思路的寄存器分配算法

C语言操作寄存器的常见手法

鸿蒙内核源码中C7,C2,C13三个寄存器

寄存器与内存的区别

寄存器的特性和四大种类

移位寄存器的原理

技术 | FANUC数据寄存器和位置寄存器的运用介绍

寄存器变量

下载排行榜

AU6815P 内置 DSP 的 2×32W 立体声 I2S数字输入D类功放芯片中文资料

A-29回音消除模块

PC4139 32V低噪音大电流白光LED恒流驱动器数据手册

双麦阵列回音消除及降噪模块 A-47 说明书

人形机器人执行、感知系统技术及市场解析

WD8002D产品规格书

32单片机 C语言寄存器（四）

寄存器是什么掌握使用寄存器做设计需要注意的事项

怎么给D寄存器输入数值三菱plc寄存器D怎么读取

单片机工作寄存器作用单片机常用专用寄存器

16位寄存器数据范围 32位寄存器数据范围数据寄存器多少位怎么算