电子说
C语言结构体对齐问题,是面试必备问题。
这不是在面试时要装B,也不是要故意难为一下面试者,而是这个知识点比较基础,但很重要。
网上搜出来的嵌入式或C语言笔试题,很多都有这种题目,连《程序员面试宝典》也有讲解这种题目。
结构体对齐知识点考察,俨然成为编程技术岗面试笔试的一种标配。
我以前找工作被问这种题的时候就经常想,结构体对齐这个东西平常很少用,考这东西干嘛?为什么结构体对齐那么重要。 看看这个例子:
typedef struct { int e_int; char e_char1; char e_char2; }S2; typedef struct { char e_char1; int e_int; char e_char2; }S3; S2 s2; S3 s3;
你觉得这俩结构体所占内存是一样大吗?其实不是!
好像也没什么啊,一不一样大对于C语言程序员有什么所谓!
也许你还还感觉不到,上段代码:
S2 s2[1024] = {0}; S3 s3[1024] = {0};
对于32位系统,s2的大小为8K,而s3的大小为12K,一放大,就有很明显的区别了。
再举个例子:
unsigned char bytes[10]={0}; int* p = (int*)&bytes[3]; *p = 0x345678;你觉得执行上面的代码会发生什么情况?Warining?只是Warning么?!
这个8位、16位和32位等,指的是单片机一次处理数据的宽度,也就和数据总线相关了。
细心的小伙伴会知道,16位单片机的通用寄存器例如R0的长度是2个字节的,而32位的是4字节的。
也就是说16位单片机,单指令一次访问数据是2个字节,而32位单片机可以访问4字节。
为了提高MCU的运行效率,内存设计上,进来适应这个CPU的总线访问。
以32位MCU为例,其内存一般都是每4字节(32位)为一个小单元,有时候也叫1个字(Word)。
注意:字节,这个概念长度是固定的,就是8bit;而字,却不是固定的,跟CPU或系统位数有关,有时候还会出现字、双字这些概念,举例说明下: 32位计算机:1字=32位=4字节,64位计算机:1字=64位=8字节 所以,对于C语言的变量的存放和访问,都会按着这单位来,例如32位系统中,char是一个字节的,就按Byte来,int是4字节的,那么按Word来。
为什么要这样呢? 如果,一块内存在地址上随便放的,CPU有可能就会用到多条指令来访问,这就会降低效率。
对于32位系统,如下图的A可能需要2条指令访问,而B只需1条指令。
不仅单片机这样,我们常用的计算机也是这样
你以为,通过总线的方式可以随便访问一个地址吗
但是,为了提高访问速度,其设计是这样的:
这样,这个地址就必须是8的倍数。 如果你要从不对齐的内存读取数据,虽然在C语言编程上感觉不到这样的操作有什么区别,但CPU是分开多次读出来的。
这就是内存对齐了。int8(即char)是以1字节对齐,int16是以2字节对齐,而int32是以4字节对齐的,等等。
世界上CPU平台、系统那么多,我们怎么知道哪个类型到底有多长,是以哪种长度对齐的?
不要瞎猜,直接上代码。每个平台都不一样,请读者自行测试,以下我是基于Windows上MinGW的GCC测的。
#define BASE_TYPE_SIZE(t) printf("%12s : %2d Byte%s ", #t, sizeof(t), (sizeof(t))>1?"s":"") void base_type_size(void) { BASE_TYPE_SIZE(void); BASE_TYPE_SIZE(char); BASE_TYPE_SIZE(short); BASE_TYPE_SIZE(int); BASE_TYPE_SIZE(long); BASE_TYPE_SIZE(long long); BASE_TYPE_SIZE(float); BASE_TYPE_SIZE(double); BASE_TYPE_SIZE(long double); BASE_TYPE_SIZE(void*); BASE_TYPE_SIZE(char*); BASE_TYPE_SIZE(int*); typedef struct { }StructNull; BASE_TYPE_SIZE(StructNull); BASE_TYPE_SIZE(StructNull*); }
结果是:
void : 1 Byte char : 1 Byte short : 2 Bytes int : 4 Bytes long : 4 Bytes long long : 8 Bytes float : 4 Bytes double : 8 Bytes long double : 12 Bytes void* : 4 Bytes char* : 4 Bytes int* : 4 Bytes StructNull : 0 Byte StructNull* : 4 Bytes
这些内容不用记住,不同平台是不一样的,使用之前,一定要亲自测试验证下。
这里先解释下“模数”的概念:
每个特定平台上的编译器都有自己的默认“对齐系数”(也叫对齐模数)。
接着看网上流传一个表:
平台 | 长度/模数 | char | short | int | long | float | double | long long | long double |
Win-32 | 长度 | 1 | 2 | 4 | 4 | 4 | 8 | 8 | 8 |
模数 | 1 | 2 | 4 | 4 | 4 | 8 | 8 | 8 | |
Linux-32 | 长度 | 1 | 2 | 4 | 4 | 4 | 8 | 8 | 12 |
模数 | 1 | 2 | 4 | 4 | 4 | 4 | 4 | 4 | |
Linux-64 | 长度 | 1 | 2 | 4 | 8 | 4 | 8 | 8 | 16 |
模数 | 1 | 2 | 4 | 8 | 4 | 8 | 8 | 16 |
本文的的例子我用的是MinGW32的GCC来测试,你猜符合上表的哪一项?
别急,再看一个例子:
typedef struct { int e_int; double e_double; }S11; S11 s11; STRUCT_E_ADDR_OFFSET(s11, e_int); STRUCT_E_ADDR_OFFSET(s11, e_double);
结果是:
s11 size = 16 s11.e_int addr: 0028FF18, offset: 0 s11 size = 16 s11.e_double addr: 0028FF20, offset: 8
很明显,上表没有一项完全对应得上的。简单汇总以下我测试的结果:
长度/模数 | char | short | int | long | float | double | long long | long double |
长度 | 1 | 2 | 4 | 4 | 4 | 8 | 8 | 12 |
模数 | 1 | 2 | 4 | 4 | 4 | 8 | 8 | 8 |
所以,再强调一下:因为环境的差异,在你参考使用之前,请自行测试一下。
其实,这个模数是可以改变的,可以用预编译命令#pragma pack(n),n=1,2,4,8,16来改变这一系数,其中的n就是你要指定的“对齐系数”。
例如
#pragma pack(1) typedef struct { char e_char; long double e_ld; }S14; #pragma pack()想知道结构图元素内存如何对齐,其实非常简单。 其实,你只需知道当前你使用的这个系统的基本类型的sizeof是多少,然后根据这个大小做对齐排布。 例如,本文一开始的例子:
typedef struct { int e_int; char e_char1; char e_char2; }S2; typedef struct { char e_char1; int e_int; char e_char2; }S3; S2 s2; S3 s3;
32位系统中,它们内存是这么对齐的:
简单解释下:
S2中的元素e_int是按4字节对齐的,其地址位4整数倍,而e_char1和e_char2就按1字节对齐,紧跟其后面就可以了;
而S3中的元素e_char1是按1字节对齐的,放在最前面,而e_int是按4字节对齐的,其地址位4整数倍,所以,只能找到个+4的位置,紧接着e_char2就按1字节对齐,跟其后面就可以了。
那么sizeof(s2)和sizeof(s3)各是多少怎么算?
也很简单,例如这个32位系统,为了提高执行效率,编译器会让数据访问以4字节为单位的,所以S2里有2个字节留空,即sizeof(s2)=8,而sizeof(s3)=12。
是不是很简单呢!
接着,来个复杂一点的:
typedef struct { char e_char1; short e_short; char e_char2; int e_int; char e_char3; }S4; S4 s4;
其内存分布如下:
按上面的方法,也不难理解。e_int是不能从+5位置开始的,因为+5不是int的对齐位置,用int去访问+5位置是效率很低或者有问题的,所以它只能从+8位置开始。
再复杂一点的呢?来看看union和struct结合的例子:
typedef struct { int e_int1; union { char ue_chars[9]; int ue_int; }u; double e_double; int e_int2; }SU2; SU2 su2;得到:
为什么这样呢? 你这样想,要时刻想着CPU访问数据的效率,如果union里的元素类型不一样,那就以最大长度的那个类型对齐了。
另外,还有结构体套着结构体的情况了:
typedef struct { int e_int; char e_char; }S1; typedef struct { S1 e_s; char e_char; }SS1; typedef struct { short e_short; char e_char; }S6; typedef struct { S6 e_s; char e_char; }SS2;
得出结果:
得出结论:结构体内的结构体,结构体内的元素并不会和结构体外的元素合并占一个对齐单元。
只要技术上面的对齐方法,这些都不难理解。 如果你非要一些规则的话,我总结成这样:
首先,不推荐记忆这些条条框框的文字,以下内容仅供参考:
结构体的内存大小,并非其内部元素大小之和;
结构体变量的起始地址,可以被最大元素基本类型大小或者模数整除;
结构体的内存对齐,按照其内部最大元素基本类型或者模数大小对齐;
模数在不同平台值不一样,也可通过#pragma pack(n)方式去改变;
如果空间地址允许,结构体内部元素会拼凑一起放在同一个对齐空间;
结构体内有结构体变量元素,其结构体并非展开后再对齐;
union和bitfield变量也遵循结构体内存对齐原则。
审核编辑:刘清
全部0条评论
快来发表一下你的评论吧 !