字符串与指针、数组与指针
定义数组时,要给出数组名和数组长度,数组名可以认为是一个指针,它指向数组的第 0 个元素。在C语言中,我们将第 0 个元素的地址称为数组的首地址,数组名的本意是表示整个数组,也就是表示多份数据的集合,但在使用过程中经常会转换为指向数组第 0 个元素的指针,所以上面使用了“认为”一词,表示数组名和数组首地址并不总是等价。
#includeint main(void) { int a[] = {1,2,3,4,5,6}; int line = sizeof(a) / sizeof(a[0]);//计算数组长度 int i; for (i = 0; i < line; i++) { printf("%d ", *(a + i)); //这里的*(a + i)相当于a[i] } return 0; } 我们使用的*(a+i)这个表达式,a 是数组名,指向数组的第 0 个元素,表示数组首地址, a+i 指向数组的第 i 个元素,*(a+i) 表示取第 i 个元素的数据,它等价于 a[i]。
我们也可以定义一个指向数组的指针,例如:
int a[]={1,2,3,4,5,6}; int *p=a; a 本身就是一个指针,可以直接赋值给指针变量 p。a 是数组第 0 个元素的地址,所以int *p = a; 也可以写作int *p = &a[0];。也就是说,a、p、&a[0] 这三种写法都是等价的, 它们都指向数组第 0 个元素,或者说指向数组的开头。 注意 :a 本身就是一个指针”这种表述并不准确,严格来说应该是“a 被转换成了一个指针, 如果一个指针指向了数组,我们就称它为数组指针(Array Pointer)
数组指针指向的是数组中的一个具体元素,而不是整个数组,所以数组指针的类型和数组元素的类型有关,上面的例子中,p 指向的数组元素是 int 类型,所以 p 的类型必须也是int *。 反过来想,p 并不知道它指向的是一个数组,p 只知道它指向的是一个整数,究竟如何使用 p 取决于程序员的编码。
数组在内存中只是数组元素的简单排列,没有开始和结束标志,在求数组的长度时不能使用指针p来sizeof(p) / sizeof(int)这样来求,因为 p 只是一个指向 int 类型的指针,编译器并不知道它指向的到底是一个整数还是一系列整数(数组),所以 sizeof(p) 求得的是 p 这个指针变量本身所占用的字节数,而不是整个数组占用的字节数。如果不知道数组的长度,那么就无法遍历整个数组
引入数组指针后,我们就有两种方案来访问数组元素了,一种是使用下标,另外一种是使用指针:
1)使用下标
也就是采用 arr[i] 的形式访问数组元素。如果 p 是指向数组 arr 的指针,那么也可以使用 p[i] 来访问数组元素,它等价于 arr[i]。
2)使用指针
也就是使用 *(p+i) 的形式访问数组元素。另外数组名本身也是指针,也可以使用 *(arr+i) 来访问数组元素,它等价于 *(p+i)。
不管是数组名还是数组指针,都可以使用上面的两种方式来访问数组元素。不同的是,数组名是常量,它的值不能改变,而数组指针是变量(除非特别指明它是常量),它的值和它的所指向可以任意改变。也就是说,数组名只能指向数组的开头,而数组指针可以先指向数组开头,再指向其他元素。
//利用自增来遍历数组 #includeint main(void) { int a[] = { 1,2,3,4,5,6 }; int line = sizeof(a) / sizeof(a[0]); int i; int *p = a;//指针p指向数组首地址 for (i = 0; i < line; i++) { printf("地址a[%d]:%p ",i,p); printf("值a[%d]:%d ", i, *p); //指针自增移动 p++; } return 0; } /*自减也是同样的效果 递增递减需要注意的: *p++;表示取出p所指向的那个数据来,完事后顺便把p移动到下一个地址位置去 , * 的优先级虽然高,但是没 有++高,这个是常用于数组之类的连续空间中, 注意: //int b[ ] = a; 不可以做 //int *p = a; 可以做 // b = a; 不可以做 //int b[ ] = -- > int * const b; 因为const表示b常量的数不能改变
另外 :
const int a[ ]={1,2,3,4,5,6}; 数组变量已经是const的指针了,这里的const表示数组的每个单元都是const int 所以必须通过初始化进行赋值。
数组变量是特殊的指针,数组变量本身表达地址,所以 int a[10];int *p=a //不用取地址值,
但是数组的单元表达的是变量,需要用&取地址, int b==&a[0];
[ ]运算符可以对数组做,也可以对指针做:p[0]=a[0];
C语言中没有特定的字符串类型,我们通常是将字符串放在一个字符数组中,所以字符数组归根结底还是一个数组,上节讲到的关于指针和数组的规则同样也适用于字符数组。更改上面的代码,使用指针的方式来输出字符串:
#include#include int main(void) { char s[] = "hello world"; char *p = s; int len = strlen(s);//获得字符串长度函数 int i; //使用指针遍历字符串输出 for (i = 0; i < len; i++) { printf("%c", *(p + i)); } printf(" "); //使用数组的方式遍历输出 for (i = 0; i < len; i++) { printf("%c", p[i]); } printf(" "); //使用指针的形式输出 for (i = 0; i < len; i++) { printf("%c", *(s + i)); } printf(" "); return 0; }
除了字符数组,C语言还支持另外一种表示字符串的方法,就是直接使用一个指针指向字符串,例如:
char *str; str = "hello world"; /*字符串指针指向的是一个字符串,str是一个char类型的指针变量, 指向字符串"hello world",指针变量str存放的是这个字符串的首地址。 所以输出的是一个字符串,应改写成printf(“%s ”,str);
字符串中的所有字符在内存中是连续排列的,str 指向的是字符串(字符数组)的第 0 个字符;我们通常将第 0 个字符的地址称为字符串的首地址。字符串中每个字符的类型都是char,所以 str 的类型也必须是char *。
这一切看起来和字符数组是多么地相似,它们都可以使用%s输出整个字符串,都可以使用*或[ ]获取单个字符,这两种方式的区别如下:
它们最根本的区别是在内存中的存储区域不一样,字符数组存储在全局数据区或栈区,第二种形式的字符串存储在常量区。全局数据区和栈区的字符串(也包括其他数据)有读取和写入的权限,而常量区的字符串(也包括其他数据)只有读取权限,没有写入权限。内存权限的不同导致的一个明显结果就是,字符数组在定义后可以读取和修改每个字符,而对于第二种形式的字符串,一旦被定义后就只能读取不能修改,任何对它的赋值都是错误的。
我们将第二种形式的字符串称为字符串常量,意思很明显,常量只能读取不能写入:
char *str = "Hello World!";//这里是字符常量是指针 str = "I love C!"; //正确 让常量字符串指针重新指向一个字符串 str[3] = 'P'; //错误 这个是想通过一个字符常量指针让一个字符数组赋值
这段代码能够正常编译和链接,但在运行时会出现段错误(Segment Fault)或者写入位置错误。
第2行代码是正确的,可以更改指针变量本身的指向;第3行代码是错误的,不能修改字符串中的字符。
那么究竟是使用字符数组还是字符串常量指针呢?在编程过程中如果只涉及到对字符串的读取,那么字符数组和字符串常量都能够满足要求;如果有写入(修改)操作,那么只能使用字符数组,不能使用字符串常量。
最后总结一下,C语言有两种表示字符串的方法:
一种是字符数组,另一种是字符串常量(即指针),它们在内存中的存储位置不同,使得字符数组可以读取和修改,而字符串常量(指针)只能读取不能修改。
审核编辑:郭婷
全部0条评论
快来发表一下你的评论吧 !