嵌入式技术
笔者今天来聊聊对于ARM几个特殊寄存器的理解,FP、SP和LR。
关于gcc就有一个关于stack frame的优化选项,加上该选项则忽略掉FP栈顶指针,(记得高版本默认是不加FP的,gcc4.8以上吧(待确认))
Don’t keep the frame pointer in a register for functions that don’t need one. This avoids the instructions to save, set up and restore frame pointers; it also makes an extra register available in many functions. It also makes debugging impossible on some machines.
(大概意思 )不需要栈帧的时候不要加这个编译选项,这可以节省很多指令去保存,传递和恢复,同时也省出一个寄存器可以在函数中做更多事情,也使得在某些机制下更容易去debug
arm cc5编译也有关于FP生成的编译选项,默认是不加的。
Sets the frame pointer to the current stack frame.Using the --use_frame_pointer option reserves a register to store the 「frame pointer」.For newer processors that support Thumb-2 technology (ARMv6T2 and later), the reserved register isalways R11.(arm v7)如果是arm v8 -a 系列,则是X29来表示。For older processors that do not support Thumb-2 technology, the reserved register is R11 in ARM codeand R7 in Thumb code.Default「The default is --no_use_frame_pointer」. That is, register R11 (or register R7 for Thumb code on olderprocessors) is available for use as a general-purpose registe
关于APCS(ARM Procedure Call Standard,ARM 程序调用标准)的说法 ,
FP的主要作用就是用来「栈回溯」,找到子程序的调用关系,也成为backtrace,当然一级一级的子程序调用时,FP的记录也在变化,也会一级一级的保存到栈中,最后通过FP的值来反推出一级一级的调用关系。
以ARM CC5 编译器为例,其栈回溯的主要逻辑如下图所示:
通过上图可以看出,main->fun1->fun2,每调用一级的时候,都会将FP、LR以及参数等压栈,而每个FP指向了上一级的栈顶,通过保存关系,可以找到LR,从而找到上一级的调用函数。
具体的流程图就如右图所示,按照这样的方法可以找到backtrace,再比如可以通过stack memory查找调用栈信息,
左图为栈memory 右图为寄存器信息。
上图中:backtrace 第一级是寄存器中的LR,之后就是从栈中进入回溯来找到的。(FP、LR)1、0x1F7BC 0x40BBAA42、0x1F7E4 0x18A3C3、0x1F7EC 0x188184、 0x1F7F4 0x40A41085、 0x1F7FC 0x15946、 0x184BC 0x40A0015
图中 LR地址都-4 这是因为LR总是保存PC的下一个运行地址,所以找到PC进函数的位置,则需要LR-4可以得到。
图中 最后栈停止回溯,可以看到栈的边界到了0x1f800,所以停止,不然会继续一直进行回溯。
backtrace的C代码如下
void get_backtrace(u32 lr, u32 fP)
{
u8 backtrace_deep = 0
u32 stack_limit=getStackLimit()
u32 stack_base=getStackBase()
printf("Bactrace info:
")
do{
if((fp <= stack_base) &&(fp >= stack_limit))
break;
lr = *(u32*)(fp)
lr (lr == OxFFFFFFFF || lr == 0x0)
break;
fp=*(u32*)(fp-sizeof(u32))
if(backtrace_deep++>MAX_BACKTRACE_DEPTH)
break;
}while(1);
printf("
");
}
12345678910111213141516171819
sp 为栈指针,通过push pop 实现对栈存储的访问,栈主要是用来存储局部变量 中间值 等数据,同样和全部变量等存储的区域一样,也是一块memory,没有任何区别,只是使用的方式不一样。
接下来简单介绍一下各个处理器架构的SP指针。
CheckSPAlignment()
bits(64) sp = SP[];
if PSTATE.EL == EL0 then
stack_align_check = (SCTLR[].SA0 != '0');
else
stack_align_check = (SCTLR[].SA != '0');
if stack_align_check && sp != Align(sp, 16) then
AArch64.SPAlignmentFault();
return;
123456789
由下图可以看到EL3下的SP有值,且与系统的SP值相同(X15下面),则处于EL3模式。
LR为程序跳转时需要用到的寄存器,用来保存「返回地址」(同时也包含异常返回地址)。
程序经常会存在调用关系,当程序执行完子程序之后,肯定会返回到主程序,这是返回到主程序的地址就是在LR保存。
在一些CorteM系列的处理,LR的第0位会置1 表示,表示Thumb状态。
当然没有LR这个寄存器也可以的,直接将返回地址保存到栈中,最后执行完之后弹出到PC也行,但是寄存器的访问速度可以远高于栈(存储器SRAM),所以LR的作用还是很明显的。
此外对应ARMv8系列,还有ELR寄存器,对应的是异常状态下的返回地址。
a. 当程序执行到异常时,异常的返回地址保存到ELR中,当然ARMv8有四种模式,EL0没有异常处理,所以只有三个ELR寄存器,处理三种异常时的返回地址。b. AArch32到AArch64状态时,保存的是32位的地址,高8位均为0。
当假如程序A->B->C,
void A()
{
.... //1地址
B(); //;BL B
.... //2地址
return;
}
void B()
{
.... //3地址
C(); //BL C
.... //4地址
return; //pop lr->PC
}
void C()
{
....
return; //B LR
}
12345678910111213141516171819
全部0条评论
快来发表一下你的评论吧 !