C语言里的整数数据类型

科技绿洲 2023-11-24 1006

描述

1. 整型数据类型

C语言里面的整数数据类型

类型名称	C语言中的关键字	注释
字符型	char	表示一个很小的整数
短整型	short	表示一个不怎么大的整数
整型	int	生活中一般的整数都可以表示
长整型	long	较大的整数
加长整型	long long	非常大的整数

一个整数而已，为什么会需要定义这么多不同的类型出来呢？

计算机通过晶体管的开关状态来记录数据。它们通常8个编为一组，我们称之为字节。而晶体管有开关两种状态，一个字节有8个晶体管，因此一个字节可以拥有2的八次方个不同的状态。让每一种状态对应一个数值，这样一个字节可以表示256个不同数值。

晶体管状态	二进制数值	十进制数值
关关关关关关关关	00000000	0
关关关关关关关开	00000001	1
关关关关关关开关	00000010	2
关关关关关关开开	00000011	3
…	…	…
开关开关开关开关	10101010	170
开开开开开开开开	11111111	255

要表示更大的数据范围就需要更多晶体管。要知道在发明C语言的年代，计算机存储资源是非常珍贵而稀缺的。如果只想表达0到100以内的数值，那么一个字节就足够了，何必用两个字节来存储？

而如今，即使存储资源已经较为丰富了，但是大部分的强类型语言，都延续了这个传统。它们均提供了丰富的类型以供选用。而程序员在编写代码时，通常能预想到需要使用到的数据范围的大小。这样在处理一个数据时，可以从语言所提供的类型中选用最合适的类型来承载数据。

在C语言标准并未规定这些数据类型的大小范围，具体的实现交由了编译器和平台决定。

2. 用sizeof关键词来测量大小

和int一样，sizeof是C语言中的一个关键词。它是英文size of连起来的合成词。翻译成中文就是什么东西的大小的意思。它能够测量C语言各种实体所占用的字节大小。

如果我们想看int所占用的字节大小，可以这样写sizeof(int)。执行后这段代码后，它的测量结果是一个整型。我们可以借助printf函数将测量结果显示在控制台上。我们现在可以假设sizeof返回的结果是int类型的，在printf函数中使用占位符%d。而更准确的用法，应该用%zu。

测量int类型所占用的字节大小，并将结果打印在控制台上的代码如下：

printf("%dn", sizeof(int));

sizeof后面既可以跟类型，也可以跟变量、常量。

跟类型，测类型所占用字节的大小。
跟变量，测变量的类型所占用字节大小。
跟常量，测常量的类型所占用字节大小。

三种情况的示例代码。

int a; 
printf("sizeof int = %dn", sizeof(int)); // 1.测类型所占用字节的大小 
printf("sizeof a = %dn", sizeof(a)); // 1.测变量的类型所占用字节大小 
printf("sizeof 123 = %dn", sizeof(123)); // 1.测常量的类型所占用字节大小

测试C语言提供的各种整型类型的大小
printf("sizeof char=%dn", sizeof(char));
printf("sizeof short=%dn", sizeof(short)); 
printf("sizeof int=%dn", sizeof(int));
printf("sizeof long=%dn", sizeof(long));
printf("sizeof long long=%dn", sizeof(longlong));
结果:char，short，int，long，long long分别占用了1，2，4，4，8个字节。至此，我们已经得知了它们所占字节大小，并且验证了可以表示越大范围的数据类型所占用的字节越多。值得注意的是int和long均占用4个字节。这并未违反C语言标准，C语言标准规定高级别的类型取值范围不得小于低级别的类型，但是它们可以是一致的。

3. 三位二进制表示的数值范围

char，short，int，long，long long分别占用了1，2，4，4，8个字节。而每个字节由8个晶体管组成，每个晶体管状态我们称之为位。那么char，short，int，long，long long分别占用了8，16，32，32，64位。

太多的位不利于理解原理，暂时把问题简化一下，试试看位数减少到3。然后，分析3位的组合，它能表示多大范围的数值.

晶体管状态	二进制数据	十进制数据
关关关	000	0
关关开	001	1
关开关	010	2
关开开	011	3
开关关	100	4
开关开	101	5
开开关	110	6
开开开	111	7

三位二进制组成的数据类型，可以表达2的3次方也就是8个数值。如果从0开始，那么可以表达从0到7的数据范围。 得出结论 ：如果不考虑负数，那么整型数据类型可以表达的数据范围是假设，位数为n，则数据范围从【0】开始，到【2的n次方-1】的数值范围。

那负数怎么办？我们需要 拿出一个位来作为符号位 。用来表示这个数据是正数还是负数。在IEEE标准中，这个符号位存在于二进制的最高位。用三位二进制来示范这种情况。

晶体管状态	二进制数据	十进制数据
关关关	000	0
关关开	001	1
关开关	010	2
关开开	011	3
开关关	100	-4
开关开	101	-3
开开关	110	-2
开开开	111	-1

加上符号之后，现在取值范围变为负4到3了。红色字体的为最高位，最高位为1的表示负数。你可能会觉得有点奇怪，为什么3的二进制是011，而负3却是101呢？如果简单的加一个符号位，为什么不用111呢？那我们看看如图中所示的3与负3相加的运算结果。

会惊奇地发现，用101来表示负3与用011表示的正3相加。结果为1000，但是由于仅有3位二进制来保存数据，最高位1被丢弃了。结果为000，居然得到了正确的结果0。

4.数值的补码表示法

时钟是一个圆被分成了12个点，让我们假设这个时钟一步只能走一个整点。那么这个时钟只有12种不同的模式，我们把12称之为时钟的模。

现在指针指向了5点，我们要让指针回到0点。一个办法是直接回退5个小时（5-5）。另一个办法是继续往前走7个小时（5+7）。

在第二种办法中，5+7=12，而12刚好为时钟的模，时钟指向12的同时，也正好指向了0。要让指针回到0点，只需要让它加上模与当前的时间的差即可。

因此，指针回退5小时与指针前进7小时是等价的。我们可以用指针前进来代替指针后退。

将这种思想带入到上面讨论的三位二进制当中。三位二进制能表示8中不同的模式，因此它的模为8。要让3回到0，我们可以让3减去3，也可以让3加上模与3的差，即8-3=5。因此，我们可以把-3在三位二进制中用5的二进制101表示。

这种将用加法来等效减法的二进制表示法被称之为补码表示法。

正数的补码就是其二进制本身。而正数对应的负数的补码为：(模 - 正数)的二进制。

	000	0
001	1
010	2
负数	模减去正数	补码	011	3
-4	8-4=4	100	100	-4
-3	8-3=5	101	101	-3
-2	8-2=6	110	110	-2
-1	8-1=7	111	111	-1

补码表示法既通过最高位，区别了正数和负数。并且，巧妙地应用了溢出，所得到的计算结果也是正确的。类似于钟表仅需要向前走就可以实现减法，计算机的电路设计中，也只需要设计加法电路。极大地简化了计算机内部电路的复杂程度。

求一个正数对应的负数的补码的第二种办法：
先写出这个正数的二进制。
从二进制的右边开始，遇到第一个1之前，全都填0。
遇到第一个1之后，把1填下来。
1之后的全部取反。

从右往左：未遇到1填0，遇到1填1，然后全部取反
十进制 0 -1 -2 -3 -4
整数二进制 000 001 010 011 100
补码 000 111 110 101 100


十进制	0	-1	-2	-3	-4
整数二进制	000	001	010	011	100
补码	000	111	110	101	100

5.各种整型类型的数值范围是多少

类型	sizeof大小	二进制位数	取值范围算式	取值范围
char	1	1×8 = 8位	-[2的7次方] ~ +[2的七次方 - 1]	-128 ~ +127
short	2	2×8 = 16位	-[2的15次方] ~ +[2的15次方 - 1]	-32,768 ~ +32,767
int	4	4×8 = 32位	-[2的31次方] ~ +[2的31次方 - 1]	-2,147,483,648 ~ +2,147,483,647
long	4	4×8 = 32位	-[2的31次方] ~ +[2的31次方 - 1]	-2,147,483,648 ~ +2,147,483,647
long long	8	8×8 = 64位	-[2的63次方] ~ +[2的63次方 - 1]	-9,223,372,036,854,775,808 ~ +9,223,372,036,854,775,807

次方数比位数少一，是因为最高位被用去做符号位了。

6. 无符号整型

如果你确定你不会用到负数，那么请使用unsigned关键词。表明这个数据类型，是不带有符号位的。既然不带有符号位了，那么原本留给符号位的那一个二进制位，可以用来表示数值。

类型	sizeof大小	二进制位数	取值访问算式	取值范围
unsigned char	1	1×8 = 8位	0 ~ +[2的8次方 - 1]	0 ~ +255
unsigned short	2	2×8 = 16位	0 ~ +[2的16次方 - 1]	0 ~ +65,535
unsigned int	4	4×8 = 32位	0 ~ +[2的32次方 - 1]	0 ~ +4,294,967,295
unsigned long	4	4×8 = 32位	0 ~ +[2的32次方 - 1]	0 ~ +4,294,967,295
unsigned long long	8	8×8 = 64位	0 ~ +[2的64次方 - 1]	0 ~ +18,446,744,073,709,551,615

打开APP阅读更多精彩内容