嵌入式Hacker (es-hacker)

Embedded bsp developer enjoys thinking and hacking opensource and develop boards(NanoPi, LicheePi, RPi...)

0%

每天一点C / 你知道数组和指针有什么区别吗?(附面试题)

哈喽,我是老吴,继续记录我的学习心得。

一、能力错觉

当书本(或谷歌)摆在眼前时,大脑会产生错觉,以为学习材料也同样存入了大脑,阅读毕竟比回想简单多了。

以为反复的阅读资料就是自己已经掌握知识,这就是能力错觉

解决能力错觉的方法:

  • 积极回想——让大脑提取关键概念,而非通过重复阅读被动地获取知识,这样才能高效地学习。

现在网络上盛行各种it类的视频教程,我不否认不少视频教程是高质量的,但是所有视频类资料都有一个问题:

  • 可以让人不用阅读书籍,减少思考,只要被动地听老师们讲课就能舒舒服服地获取到知识,这很容易会让某些初级的软件开发人员形成能力错觉,仿佛视频里写过的代码,解决过的 bug 都是自己已经学到的知识似的。

有效的解决办法是

  • 公开学习笔记和练习代码。公开学习笔记的目的是借助外部压力,高效回想,进而提高自己的学习标准。

  • 另外,公开写作则会给你的写作增加很多维度的外部压力,你会想如何让别人更好地理解我要表达的意思;如何传递更多价值,让别人读完有所收获;如何让更多人看到;如何让别人读得下去;如何排版让大家看得更舒服;


二、数组和指针有什么区别?

正文目录:

1
1. 用于声明时两者有重大区别
2
2. 你真的理解声明和定义吗?
3
3. 数组和指针的底层是如何访问数据的?
4
4. 哪些场景可以用指针代替数组?
5
5. 为什么C语言要把数组形参退化为指针?
6
6. 如何使用指针访问多维数组?
7
7. 相关面试题

写作目的:

  • 正确看待数组和指针。

测试环境:

  • Ubuntu 16.04
  • Gcc 5.4.0

1. 用于声明时两者有重大区别

1) 误导新手的说法:

由于数组和指针的所谓等价性非常接近,不少程序员有时忽视了二者之间的其他重要区别 ,最误导新手的说法之一就是 “数组和指针是相同的”,这是一种非常危险的说法。

看下面这个例子:

1
extern int *x;
2
extern int x[];
  • 第一条语句声明 x 是个 int 型的指针;

  • 第二条语句声明 x 是个 int 型数组,长度尚未确定,即存储长度在别处定义。

2) 为什么有些人会误以为指针和数组总是可以互换?

最主要原因是
对数组的引用 ( x[i] ) 总是可以写成对指针的引用 ( *(x+i) )

  • 即确实存在一种指针和数组的定义完全相同的上下文环境。不幸的是,这只是数组的一种极为普通的用法,并非所有情况下都是如此。

2. 你真的理解声明和定义吗?

想要要真正理解为什么 extern int *x 不等于 extern int x[],我们首先需要搞清楚什么是声明,什么是定义。

1) 链接器的视角:

  • C 语言中的对象必须有且只有一个定义,但它可以有多个 extern 声明。这里所说的对象跟 C++ 中的对象并无关系,这里说的对象是 从链接器的视角来看的,链接器将各个函数、变量都视为对象

2) 定义和声明的联系与区别:

  • 定义是一种特殊的声明,它创建了一个对象;声明简单地说明了在其他地方创建的对象的名字。

  • 定义只能出现在一个地方,它指定了对象的类型并分配内存以创建新的对象。声明可以多次出现 以描述对象的类型,用于指代其他地方定义的对象,它不为对象分配内存。

  • extern 对象声明告诉编译器对象的类型和名字,对象的内存分配则在别处进行。由于并未在声明中为数组分配内存,所以并不需要提供关于数组长度的信息 (多维数组例外)。

3) 总结成一句话:

  • 定义 = 声明 + 分配内存 (创建对象)

4) 回过头来看这个例子:

1
extern int *x;
2
extern int x[];

前者声明了一个指针,后者声明了一个数组,那么它们对应的指针和数组的定义(最重要的是内存分配) 能相等吗?


3. 数组和指针的底层是如何访问数据的?

现在我们来看看指针和数组的定义与使用。

1) “地址 X (Address)” 和 “地址 X 的内容(Contents of Address)” 之间的区别:

对于”地址 X” 和 “地址 X 的内容”,在 C 语言中是用同一个符号来表示这两样东西,由编译器根据上下文环境判断它的具体含义。

2) 看下面这个例子:

1
X = Y
  • 符号 X 的含义是 X 所代表的地址,它是左值,编译时可知;

  • 符号 Y 的含义是 Y 所代表的地址上的内容,它是右值,运行时才知;

  • 左值包括可修改的左值和不可修改的左值,C 语言中,一般的数据类型都是都可作为可修改的左值,只有数组是不可修改的左值;

  • 数组的地址在编译时可知,编译器有了这个地址 (即数组首地址),就可以直接进行读写操作。而指针必须在运行时取得它的当前值,然后才能对它进行解除引用操作,才能进行读写操作。

3) 数组和指针的访问方式是不同的:

1
char a[9] = "abcedefgh";

访问数组

  • 上面这个例子中,a 是一个数组。

  • 在编译器符号表里有一个符号 a ,它的地址为9980;

  • 数组内的字符都可以从这个地址 + 偏移量找到,编译器甚至并不需要知道数组的总长度;

1
char c = 'F';
2
char *p = &c;

使用指针访问字符

  • 上面这个例子中,p 是一个指针。

  • 在编译器符号表中有一个符号 p, 它的地址为 4624;

  • p 指向的对象是一个字符。为了取得这个字符,必须得到地址 p 的内容 (5081),把它作为字符的地址并从这个地址中取得这个字符 (‘F’)。

4) 当定义为指针 (char *p),并以数组方式 (p[i]) 引用时会发生什么?

1
char *p = ”abcdefgh”
2
printf("%c\n", p[3]);
3
4
char *a = ”abcdefgh”
5
printf("%c\n", a[3]);
  • p[3] 和 a[3] 都能成功访问到字符 ‘d’;

  • p[i] 表示 “从 a 的地址开始,前进 i 步,每步都是一个字符(数组类型的长度)”;

  • p[i] 表示 “从 p 所指的地址开始,前进 i 步,每步都是一个字符(即指针所指类型的长度)”;

  • 所以,当你你用 extern char p 来声明 char p[10]时,编译器会把 p[i] 当成一个指针(Address),然后去获取 (p[i]) (即 Content of Addrss),这时最好的结果是程序立马崩溃,你能快点发现问题。最糟糕的情况是,程序崩溃在将来的某个时刻,你则 debug 到怀疑人生**。


4. 哪些场景可以用指针代替数组?

数组和指针容易混淆使用的 2 大类场景:

  • 声明

  • 在表达式中使用;

1) 声明:
声明的场景包括 3 种:

  • 1> 不可以的场景:定义也是一种声明,定义数组时不能用指针的形式;

  • 2> 不可以的场景:extern 数组时不能改写成指针的形式, 例如:

1
int char[10];    // define
2
extern char a[]; // ok
3
extern char *a;  // error
  • 3> 可以的场景:函数的形参,用数组形式还是指针形式,随你自己的喜好。

2) 在表达式中使用:

  • 在表达式中,指针形式和数组形式等效。

3) 几条重要的规则:

  • 规则1:”表达式中的数组名” 就是指针;

  • 规则2:把数组下标可当作指针的偏移量;

  • 规则3: “作为函数参数的数组名” 等同于指针;


5. 为什么 C 语言要把数组形参退化为指针?

1) 出于效率的考虑:

  • 在 C 语言中,所有非数组形式的数据实参均以传值形式(对实参作一份拷贝并传递给调用的函数,函数不能修改作为实参的实际变量的值)。

  • 如果要拷贝整个数组,无论在时间上还是在内存空间上的开销都可能是非常大的

2) 出于简化编译器的考虑:

  • 在 C 语言中,所有的数组在作为参数传递时都转换为指向数组起始地址的指针,而其他的参数均采用传值调用。

  • 允许程序员把形参声明为数组 (程序员打算传递给函数的东西) 或者指针 (函数实际所接收到的东西)。在函数内部,编译器始终把它当作一个指向数组第一个元素的指针

3) 看下面这个例子:

1
static int array[10], array2[10];
2
3
static void func1(int *ptr)
4
{
5
    ptr[1] = 3;
6
    *ptr = 3;
7
    ptr = array2;
8
}
9
10
static void func2(int array[])
11
{
12
    array[1] = 3;
13
    *array = 3;
14
    array = array2;   // OK, because array is a pointer
15
    printf("*array=%d\n", *array);
16
}
17
18
int main(void)
19
{
20
    func1(array);
21
    func2(array);
22
    
23
    array[1] = 3;
24
    *array = 3;
25
    array = array2; // ERROR
26
    return 0;
27
}

编译运行:

1
// main 中调用 array = array2时:
2
11: error: assignment to expression with array type
3
4
// 去掉 main / array = array2时:
5
$ ./point_array_arg
6
*array=0

6. 如何使用指针访问多维数组?

1) C 语言的多维数组:

  • 采用最右的下标先变化原则,其最大的用途是存储多个字符串;

  • 单个元素的存储和引用实际上是以线性形式排列在内存中;

  • 不能把一个数组赋值给另一个数组,因为数组作为一个整体不能成为赋值的对象;

  • 可以把数组名赋值给一个指针,是因为在表达式中的数组名被编译器当作一个指针;

  • 指针下标引用的规则告诉我们 pea[i][j] 被编译器解释为 ((pea + i) + j);

  • 可以通过声明一个一维指针数组 ( (char *)pea[4],下标方括号的优先级比指针的星号高),其中每个指针指向一个字符串,来取得类似二维字符数组的效果;

指针数组

7. 相关面试题

1) 找错:计算字符串长度

下面这段程序是为了把字符串转换为大写:

1
#include <stdio.h>
2
3
void UpperCase(char str[])
4
{
5
    int test = sizeof(str);
6
    int test2 = sizeof(str[0]);
7
8
    for(size_t i=0; i<sizeof(str)/sizeof(str[0]); ++i) {
9
        if('a'<=str[i] && str[i]<='z')
10
            str[i] -= ('a'-'A');
11
    }
12
}
13
14
15
16
int main(void)
17
{
18
19
    char str[] = "aBcDeefGHijKL";
20
    printf("The length of str is %d\n", sizeof(str)/sizeof(str[0]));
21
22
    UpperCase(str);
23
    printf("result: %s\n", str);
24
    return 0;
25
}

运行结果:

1
$ ./sizeof_array 
2
The length of str is 14
3
result: ABCDEEFGHijKL

问题出在 UpperCase() 里的 sizeof(str),这里的 str 是一个指针而不是数组

正确的写法有2种

  • 给UpperCase 传递长度参数,这是最稳妥的方式。
  • 在UpperCase 内使用strlen 获取字符串长度,这种方法仅适用于以 ‘\0’ 结尾的字符数组;

相关参考

  • 《你必须知道的 495 个 C语言问题》, 第 6.1-6.23 章节
  • 《C 专家编程》, 第 4/9/10 章节
  • 《C Primer Plus 6th》, 第 10 章节
  • 《C 和 C++ 程序员面试秘籍》, 第 3 章
  • 《C 和指针》, NULL

三、思考技术,也思考人生

学习技术,更要学习如何生活

你和我各有一个苹果,如果我们交换苹果的话,我们还是只有一个苹果。但当你和我各有一个想法,我们交换想法的话,我们就都有两个想法了。

嵌入式系统 (Linux、RTOS、OpenWrt、Android) 和 开源软件 感兴趣,想和更多人互相交流学习,请关注公众号:嵌入式Hacker,一起来学习吧。

无论是关注或转发,还是打赏,都是对作者莫大的支持。觉得文章对你有价值的话,不妨点个 在看和点赞 哦。

欢迎加入我的微信群:先加我,我拉你进群,暗号(我最棒)。

祝各位工作顺利,家庭幸福,财源滚滚~

这是一篇有趣的文章吗?

欢迎关注我的其它发布渠道