高效的C编程之函数调用

消耗积分:1 | 格式:rar | 大小:0.5 MB | 2017-10-17

分享资料个

14.9 函数调用
　　函数设计的基本原则是使其函数体尽量的小。这样编译器可以对函数做更多的优化。
　　14.9.1 减少函数调用开销
　　ARM上的函数调用开销比非RISC体系结构上的调用开销小：
　　· 调用返回指令“BL”或“MOV pc，lr”一般只需要6个指令周期（ARM7上）。
　　· 在函数的入口和出口使用多寄存器加载/存储指令LDM和STM（Thumb指令使用PUSH和POP）提高函数体的执行效率。
　　ARM体系结构过程调用标准AAPCS定义了如何通过寄存器传递参数和返回值。函数中的前4个整型参数是通过ARM的前4个寄存器r0、r1、r2和r3来传递的。传递参数可以是与整型兼容的数据类型，如字符类型char、半字类型short等。
　　注意如果是双字类型，如long long型，只能通过寄存器传递两个参数。
　　不能通过寄存器传递的参数，通过函数堆栈来传递。这样不论是函数的调用者还是被调用者都必须通过访问堆栈来访问参数，使程序的执行效率下降。
　　下面的例子显示了函数调用是传递4个参数和多于4个参数的区别。
　　传递4个参数的函数调用源文件如下。
　　int func1（int a， int b， int c， int d）
　　{
　　return a+b+c+d;
　　}
　　int caller1（void）
　　{
　　return func1（1，2，3，4）;
　　}
　　编译的结果如下。
　　func1
　　ADD r0，r0，r1
　　ADD r0，r0，r2
　　ADD r0，r0，r3
　　MOV pc，lr
　　caller1
　　MOV r3，#4
　　MOV r2，#3
　　MOV r1，#2
　　MOV r0，#1
　　B func1
　　如果程序需要传递6个参数，变为如下形式。
　　int func2（int a， int b， int c， int d，int e，int f）
　　{
　　return a+b+c+d+e+f;
　　}
　　int caller2（void）
　　{
　　return func1（1，2，3，4，5，6）;
　　}
　　则编译后的汇编文件如下。
　　func2
　　STR lr，［sp，#-4］！
　　ADD r0，r0，r1
　　ADD r0，r0，r2
　　ADD r0，r0，r3
　　LDMIB sp，{r12，r14}
　　ADD r0，r0，r12
　　ADD r0，r0，r14
　　LDR pc，{sp}，#4
　　caller2
　　STMFD sp！，{r2，r3，lr}
　　MOV r3，#6
　　MOV r2，#5
　　STMIA sp，{r2，r3}
　　MOV r3，#4
　　MOV r2，#3
　　MOV r1，#2
　　MOV r0，#1
　　BL func2
　　LDMFD sp！，{r2，r3，pc}
　　综上所述，为了在程序中高效的调用函数，最好遵循以下规则。
　　· 尽量限制函数的参数，不要超过4个，这样函数调用的效率会更高。
　　· 当传递的参数超过4个时，要将多个相关参数组织在一个结构体中，用传递结构体指针来代替多个参数。
　　· 避免将传递的参数定义为long long型，因为传递一个long long型的数据将会占用两个32位寄存器。
　　· 函数中存在浮点运算时，避免使用double型参数。
　　14.9.2 使用__value_in_regs返回结构体
　　编译选项__value_in_regs指示编译器在整数寄存器中返回4个整数字的结构或者在浮点寄存器中返回4个浮点型或双精度型值，而不使用存储器。
　　下面的例子显示了__value_in_regs选项的用法。
　　typedef struct { int hi; uint lo; } int64; // 注意该结构中，高位为有符号整数，低位为无符号整数
　　__value_in_regs int64 add64（int64 x， int64 y）
　　{ int64 res;
　　res.lo = x.lo + y.lo;
　　res.hi = x.hi + y.hi;
　　if （res.lo 《 y.lo） res.hi++; // carry from low word
　　return res;
　　}
　　void test（void）
　　{ int64 a， b， c， sum;
　　a.hi = 0x00000000; a.lo = 0xF0000000;
　　b.hi = 0x00000001; b.lo = 0x10000001;
　　sum = add64（a， b）;
　　c.hi = 0x00000002; c.lo = 0xFFFFFFFF;
　　sum = add64（sum， c）;
　　}
　　编译后的结果如下所示。
　　add64
　　ADDS a2，a2，a4
　　ADC a1，a3，a1
　　MOV pc，lr
　　test
　　STMDB sp！，{lr}
　　MOV a1，#0
　　MOV a2，#&f0000000
　　MOV a3，#1
　　MOV a4，#&10000001
　　BL add64
　　MOV a3，#2
　　MVN a4，#0
　　LDMIA sp！，{lr}
　　B add64
　　当使用__value_in_regs定义结构体时，编译的代码大小为52字节，如果不使用__value_in_regs选项，则编译出的结果为160字节（本书中没有列出未使用__value_in_regs时的编译结果，读者有兴趣可以自己上机试验）。
　　14.9.3 叶子函数
　　所谓叶子函数（leaf function）就是在其函数体内不存在对其他函数调用，它也常被称为终级函数。因为叶子函数不需要调用其他函数，所有没有保存/恢复寄存器的操作，因此执行效率比一般函数要高。
　　当函数中必须对一些寄存器进行保存时，可以使用高效率的多寄存器存储指令STM，对需要保存的寄存器内存一次性存储。
　　正是由于叶子函数执行的高效性，所以在编程时，尽量将子程序编写为叶子函数，这样即使程序中多次调用也不会影响代码性能。
　　为了高效的调用函数，可以遵循下面函数调用原则。
　　· 避免在被频繁调用的函数中调用其他函数，以保证被频繁调用的函数被编译器编译为叶子函数。
　　· 把比较小的被调用函数和调用函数放在同一个源文件中，并且要先定义后调用，编译器就可以优化函数调用或内联较小的函数。
　　· 对性能影响较大的重要函数可使用关键字_inline进行内联。
　　14.9.4 嵌套优化
　　注意嵌套优化（Tail－Call optimization）只适用于armcc。编译时如果使用-g或-debug选项，编译器自动关闭该功能。
　　一个函数如果在其结束时调用了另一个函数，则编译器使用B指令调转到被调用函数，而非BL指令。这样就避免了一级不必要的函数返回。图14.3显示了嵌套优化的调用过程。
　　高效的C编程之函数调用

　　图14.3 嵌套优化函数调用过程
　　当编译时使用-O1或-O2选项时，编译器都执行这种嵌套优化。需要注意的是，当函数中引用了局部变量地址，由于指针别名问题的影响，即使函数在返回时调用了其他函数，编译器也不会使用嵌套优化。
　　下面通过一个例子来分析嵌套优化是如何提高代码执行效率的。
　　extern int func2（int）;
　　int func1 （int a， int b）
　　{ if （a 》 b）
　　return （func2（a - b））;
　　else
　　return （func2（b - a））;
　　}
　　编译后的代码如下所示。
　　func1
　　CMP a1，a2
　　SUBLE a1，a2，a1
　　SUBGT a1，a1，a2
　　B func2
　　首先，func1中使用B指令代替BL指令，不用担心lr寄存器被破坏，减少了对寄存器压栈保护操作。另外，程序直接从func2返回到调用func1的函数，减少一次函数返回。如果说正常的指令调用过程为：
　　BL + BL+ MOV pc，lr + MOV pc，lr
　　那么经过嵌套优化的函数调用过程就可以表示为：
　　BL + BL+ MOV pc，lr
　　这样，总的开销将减少25％。
　　14.9.5 单纯子函数
　　所谓单纯子函数（Pure Functions）是指那些函数返回值只和调用参数有关。换句话说，就是如果调用函数的参数相同，那么函数的返回结果也相同。如果程序中存在这样的函数，可以在函数定义时使用_pure进行声明，这样在程序编译时编译器会根据函数的调用情况对其进行优化。
　　下面的例子显示了当函数用_pure声明时，编译器对其所做的优化。
　　程序源码文件如下。
　　int square（int x）
　　{
　　return x * x;
　　}
　　int f（int n）
　　{
　　return square（n） + square（n）
　　}
　　编译后的结果如下。
　　square
　　MOV a2，a1
　　MUL a1，a2，a2
　　MOV pc，lr
　　f
　　STMDB sp！，{lr}
　　MOV a3，a1
　　BL square
　　MOV a4，a1
　　MOV a1，a3
　　BL square
　　ADD a1，a4，a1
　　LDMIA sp！，{pc}
　　上面的程序中，square函数为“单纯子函数”，当使用_pure声明该函数时编译器在调用该函数时，将对程序进行优化。
　　声明的方法和编译后的结果如下所示。
　　__pure int square（int x）
　　{
　　return x * x;
　　}
　　f
　　STMDB sp！，{lr}
　　BL square
　　MOV a1，a1，LSL #1
　　LDMIA sp！，{pc}
　　从编译后的代码中可以看到，用_pure声明的函数在f函数中只调用了一次。
　　虽然“单纯子函数”可以提高代码执行效率，但同时也会带来一些负面影响。比如，在“单纯子函数”中，不能直接或间接访问内存地址。所以在程序中使用“单纯子函数”时要特别小心。
　　另外，还可以使用#pragma声明“单纯子函数”，下面的代码显示了它的声明过程。
　　#pragma no_side_effects
　　/* function definition */
　　#pragma side_effects

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

AU6815P 内置 DSP 的 2×32W 立体声 I2S数字输入D类功放芯片中文资料
2026-04-27 3次下载

下载
A-29回音消除模块
2026-05-07 2次下载

下载
PC4139 32V低噪音大电流白光LED恒流驱动器数据手册
2026-04-27 2次下载

下载
双麦阵列回音消除及降噪模块 A-47 说明书
2026-05-07 2次下载

下载
人形机器人执行、感知系统技术及市场解析
2026-05-20 2次下载

下载
WD8002D产品规格书
2026-04-27 1次下载

下载

高效的C编程之函数调用

EE-128：C语言中的DSP：从C调用汇编类成员函数

C调用matlab方法

C语言标准库函数

C++ C语言函数查询电子版下载

C和C++实物精选《C专家编程》

LABVIEW调用C# DLL的实例分享

51单片机编程之中断函数using关键字的作用

LabViEW编程之VI服务器综述

Windows编程之数据类型综述

Windows编程之变量与可变性详解

Windows编程之变量和常量差异综述

Windows编程之数值运算综述

Windows编程之变量和可变性综述

EE-128：C++中的DSP：从C++调用汇编类成员函数

C语言编程常用的文件处理函数汇总下载

C语言编程文件操作函数库汇总资源下载

C语言编程函数库分类汇总资源下载

C语言编程屏幕函数源码汇总资源下载

C语言编程字符串函数汇总资源下载

Linux常用C函数库电子版下载

FreeRTOS中的API函数功能分析及调用方法

C代码与javaScript函数的相互调用问题应该如何解决

C指针编程之道PDF电子书免费下载

西门子PLC教程之结构化编程的详细资料说明

C语言教程之函数的详细资料说明

C51的函数学习课件教程免费下载

C语言函数的实验详细资料说明

KEIL C51的重入函数的详细资料讲解

单片机C语言不完全编程的规范详细说明

如何实现VisualC++与MATLAB接口进行混合编程详细方法说明

通过编程实现atoi函数的程序免费下载

C语言中的内联函数与宏

python调用math函数的方法

如何查看及更改函数/函数块的调用环境

Python 简化函数调用的3种技巧

python定义函数与调用函数的顺序

python函数与函数之间的调用

一文详解python调用函数

调用SCL函数块-事例

C语言使用回调函数模拟委托与反射

C函数调用机制与栈帧原理详解

SCL中调用函数的示例

前端开发之函数式编程实践

什么是函数的调用？

C语言函数调用的形式及过程

浅析C++执行构造函数编程实例

函数调用时底层会发生什么

嵌入式软件架构设计之函数调用

系统调用与普通的函数调用之间的区别

虚函数，C++开发者如何有效利用

如何写要被C调用的汇编函数

C语言使用函数调用在内存中究竟发生了什么？

汇编语言模块调用C++函数实例

C语言函数调用的三种方式

C语言使用函数调用的知识点

怎么在C语言调用系统指令

C语言-函数的定义、声明、传参

C语言代码中调用汇编函数需要注意什么

为什么中断处理函数不能直接调用不可重入函数

C语言函数调用过程中的内存变化解析

带你了解嵌入式C语言函数调用栈

下载排行榜

AU6815P 内置 DSP 的 2×32W 立体声 I2S数字输入D类功放芯片中文资料

A-29回音消除模块

PC4139 32V低噪音大电流白光LED恒流驱动器数据手册

双麦阵列回音消除及降噪模块 A-47 说明书

人形机器人执行、感知系统技术及市场解析

WD8002D产品规格书