C语言函数为什么不能返回数组？

在C语言程序开发中，我们不可以编写下面这样的代码：

char f(void)[8] { char ret; // ...fill... return ret;}int main(int argc, char ** argv) { char obj_a[10]; obj_a = f();}

不可以编写这样的代码

这其实就是不能在C语言函数中返回数组。但是如果将数组定义在结构体里面，就可以将其返回了，例如下面这段C语言代码，请看：


struct s { char arr[10]; };struct s f(void) { struct s ret; // ...fill... return ret;}int main(int argc, char ** argv) { struct s obj_a; obj_a = f();}

函数可以返回结构体

结构体 s 只有一个数组成员 arr，显然，函数可以返回结构体，即使结构体只有一个数组成员，这是为什么呢？

因为C语言没有严格意义上的“数组类型”！

基本上，C语言中的数据结构可以分为两类，第一类数据结构可以被赋值，而第二类数据结构不可以被赋值，数组属于第二类数据结构。

除了数组，还有其他第二类数据结构吗？我想基本上没有了，除非把函数算上。

与函数不能返回数组密切相关的事实是，C语言没有严格意义上的“数组类型”。可能从C语言代码角度来看，似乎有数组类型的变量，但是如果尝试将该变量像其他变量一样使用，得到的实际上是指向数组第一个元素的指针。例如下面这段C语言代码：

char a[10], b[10];a = b;

这并不能把数组 b 的内容拷贝给数组 a，实际上，上面两行C语言代码相当于下面这一行：


a = &b[0];

显然，左边是数组 a，而右边其实是一个指针。即使数组在某种程度上可以看作能够被赋值，但我们有很大几率得到类型不匹配，例如下面这段C语言代码：


a = f();

这里假设 f() 是一个返回数组的函数，它的核心C语言代码如下：


char ret[10];/* ... fill ... */return ret;

不过按照前面所说的，其实上面的返回语句相当于下面这一句：


return &ret[0];

同样的，我们若是尝试将数组赋值给 a，最终实际得到仍然是将指针赋值给 a，熟悉C语言语法的读者应该能够看出不妥之处。

为什么把数组塞入结构体，情况就不同了呢？

文章开头提到，虽然C语言的数组不可以被赋值，但是将其塞入结构体就可以赋值了。这是什么原因呢？

其实，这涉及到C语言的设计初衷，以及相关的一些发展历史了。C语言在语法和语义上与机器硬件很接近，它的基本操作可以被编译为一个或者几个机器指令，占用若干个处理器周期。

C语言中的数组是特殊的，它与指针一直都是非常暧昧的。这种暧昧的关系从C语言的前身B语言就开始了，并一直延续至今，而今天的结构体语法最初并不是包含在C语言中的。

因为C语言数组与指针的暧昧关系，编译器也很难区分它们，所以我们不可能为C语言数组赋值。而且由于“赋值”操作也属于C语言的基本操作，为了贴合硬件，要求其必须在几个处理器周期完成，所以单个的“赋值”运算符 = 基本上不可能扩展到需要几千乃至几万个机器周期，以对成千上万个数组元素赋值。

基于这样的原理，早期的C语言其实连结构体赋值都是不支持的。

到这里，相信不少读者又有疑问了，既然C语言的基本操作需要控制在少量的机器周期内，那为什么结构体赋值却是支持的呢？毕竟C语言中的结构体也是可以包含多个字节信息的。

C语言中的结构体也可包含多个字节信息

正如前文所说，早期的C语言的确不支持结构体赋值，但是在后来的发展中却增加了结构体赋值能力。对此只能说是结构体幸运，“将C语言基本操作控制在少量机器周期内”只是一个准则，而不是限制。

要知道，C语言结构体通常很小，只有几十到几百字节，增加结构体赋值能力无疑能够大大方便程序员编写代码。大多数情况下，结构体赋值操作并不会严重“超时”，这其实是一种平衡。

我之前的文章曾经讨论过，程序设计语言一般都要处理一个天平，天平的两端分别是机器和程序员，如果追求极致的机器效率，将编程语言设计的十分精简，那么程序员就会非常痛苦。因此，即使是C语言，在追求高效率的同时，也要兼顾程序员的感受，所以稍稍违背一些设计准则，增加一些便利操作也是无可厚非的。

小结

C语言不支持数组赋值，更多的原因是C语言本身的特点（贴合硬件）以及一些历史原因。不过，如果真的希望对数组赋值，也是有一些技巧的，例如将数组塞入结构体。这一点我之前的文章已经讨论过，不再赘述了。

推荐阅读：

关注公众号，后台回复「1024」获取学习资料网盘链接。

欢迎点赞，关注，转发，在看，您的每一次鼓励，我都将铭记于心~