50 岁的 C 语言,为什么依然稳如泰山?

小林coding

共 3761字,需浏览 8分钟

 ·

2022-07-22 10:51

C语言是个很有意思的话题。

对于计算机专业的学生来说,C语言可以算是本专业的另一门“普通话”。曾经看过一份资料,说国内九成高校在给大一开设的“高级编程语言”一课中选择使用C语言,而这仅仅只是开始。

我们知道,计算机专业是有几门“硬菜”课程的,比如说数据结构、算法、编译原理和操作系统,这些课程都有自己的知识体系,不过,所使用的教材很可能会在书名后面多加一个括号写上“C语言描述”,这是因为计算机专业的知识总是需要通过编程才能落地见效,而教材们都喜欢选择用C语言来示例编程。

可以说,计算机的专业课基本上就是个C语言宇宙,哪怕是毕业多年以后重聚,说一句“Long time no C”,一定都能引得大家会心一笑和无限回忆。

不过,疑惑随之而来。前两年一位985的学生在网上发帖询问:为什么现在学校还在教授C语言,而不选择更为“现代”的Java或者Python?

这贴很快变成圈内热帖,大家一时议论纷纷。在很多人看来,诞生于1973年的C语言虽然历史地位无法撼动,但已经是一款爷爷辈的老语言,早就该到了“尚能饭否”的年纪。

那么,应该学什么呢?在20年前互联网刚刚兴起的时候,大家都想去学更时髦的Java,而到了机器学习大红大紫的现在,则很难拒绝Python的诱惑。

近几年Rust、Go、Swift等新语言像雨后春笋般冒出来,隔一段时间就来一版重大更新,变着花样在刺激着大家喜新厌旧的神经。所以,每隔一段时间网上就会掀起一阵“是时候要换掉C语言”的讨论。

不过,C语言真的已经是时代的眼泪了吗?


01


稳如泰山的C语言



大家都知道的是,当下很多主流的编程语言,其实都和C语言有着紧密的血缘关系,C++就是C语言加上面向对象,C++--又派生出了Java,至于受C++和Java影响而派生的语言又不知道有多少,真可谓一生二、二生三、三生万物。不过,也许大家并不了解,虽然C语言儿孙满堂,但自身还正处在当打之年,和子孙同台竞技不落半点下风

TIOBE是业内知名的编程语言排行榜,我查了一下最近20年的排名记录,惊讶地发现虽然各色编程语言一直在TIOBE上你方唱罢我登场,但是C语言始终稳如老狗,一直像钉子一样钉在前2位置霸榜,不时还偷摸一把排名第一的宝座。近几年Python乘着机器学习的东风从一个胜利走向另一个胜利,最近更是成功把Java从王座上请了下来,然而回头一看,发现排在第二的居然还是C语言



这就很有意思了。也许有人会认为,这是因为C语言占了时间悠久的便宜,历史上积累下来的代码量大,所以比重就大。不过,TIOBE是综合了全球在搜索引擎中的搜索次数、各类课程的使用次数,以及业内资深专家和厂商的使用偏好等等因素综合计算给出的排名结果,反映的是编程语言在全球的热度,而不是机械地比较代码量。从TIOBE的排名可以看出,不仅仅是国内高校,即使放眼全球的教育界和工业界,C语言都仍然是稳稳当当的老大哥。

不过,编程语言领域早就卷得一塌糊涂,为什么一款诞生了50年的编程语言居然还能傲视群雄,其中是不是有什么成功的秘密呢?


02


成功的秘密


在我看来,C语言最大的成功就是准确卡位。C语言有一本当之无愧的经典之作,叫作《The C Programming Language》,机工华章出了中文版,译为《C程序设计语言》,作者是B.W.Kernighan和D.M.Ritchie,也称为K&R,而其中的R——D.M.Ritchie正是C语言的作者。



《C程序设计语言》不但是C语言的经典教材,还是教材的教材,大家都在通过这本书学习怎么写教材,我们学习新语言都会从打印“hello,world”开始,这个传统就是起源于这本书。

《C程序设计语言》谈到了C语言的优势,说:C语言是一种通用的程序设计语言,既不“高级”也不庞大,它与UNIX系统关系密切,但并不受限于任何一种操作系统或机器,很适合用来编写编译器和操作系统,因此被称为“系统编程语言”。

C语言的秘密就藏在这句“既不‘高级’也不庞大”里面。这里的“高级”并不是指编程语言的水平高低,而是相对于底层硬件的抽象,越高级的编程语言,会越模糊底层的硬件细节。

C语言虽然经常用于教授“高级编程语言”这门课,但既不是第一款高级编程语言,也不是最高级的编程语言。C语言借鉴了BCPL语言的很多概念,而BCPL语言本身比C语言还要高级一点。BCPL语言注重的是算法,并没有设置“类型”这一概念,也即我们在C语言里面十分熟悉的字符、整型和浮点型这些类型,在BCPL语言都是没有的。我曾经出于好奇找过BCPL的代码来看,感觉这种尽量剥离底层硬件细节的编程语言写起来更像是伪代码。

其实,很多现代编程语言也在淡化类型这一概念,Python一类的动态语言使用的是“鸭子类型”,不用显示声明变量类型,而传统强类型的静态语言则选择了“类型推断”来曲线救国,相比之下,强调类型的C语言就要低级得多。

不过,低级有低级的好处,C语言设计的类型并非凭空生造,而是对底层硬件的概括描述,尤为适合精准地操纵计算机底层硬件。我们写操作系统、写驱动、写单片机、或者写一些想要榨干硬件性能的程序,就必须选择这种能够看到底层硬件细节的编程语言。

有人会说,汇编也是低级语言,也能操纵硬件,也能看到硬件细节,甚至能看到更多的硬件细节,为什么不选择汇编呢?这是因为C语言比汇编又高级一点,在开发效率和开发体验方面是降维打击。正是因为C语言比低级语言要高级一点,又比高级语言要低一点,在一众编程语言中硬生生地开辟出叫“系统编程语言”的生态位这是个很特殊的生态位,IT生态越是枝繁叶茂,面向应用开发的高级编程语言竞争越是激烈,系统编程语言的地位就越重要越稳固。

也许又有人会说,能不能用Java和Python这些更现代的编程语言干系统编程语言的活呢?很难。C语言中有一个让所有人既爱又恨的语言特性,叫做指针。指针很神奇,它很灵活,也是个小恶魔,很多开发者把C语言称作“灾难”,那么灾难的源头就是指针。所以,当初Java推出来的时候,就把干掉指针作为其中一个重要卖点。灵活和安全是一对矛盾体,主流的开发语言都选择了牺牲灵活性来提升安全性,当然代价也就是不再可能染指系统编程语言这一生态位了。



03


不断进化


提升软件开发能力当然很重要,想要熟悉主流的编程语言无可厚非。不过,软件开发并非只是编程,而对于计算机专业来说,软件开发也远非全部内容,全面地理解计算机体系结构也许更符合这个专业的教学目的。从这个角度来看,准确卡位的C语言确实比Java和Python更为适合。

不过,C语言也并不是靠精准卡位的老本吃到了现在。在阅读C语言的相关文献时,有时会看到C89、C99、C11、C2x之类的神秘数字,譬如说Linux内核在从C89向C11迁移中取得了一些进展,又譬如说Visual Studio 开始支持C11 和 C17 。这些神秘数字正是C语言在不断进化的证据。

C语言诞生于50年前,无论设计在当时来说多么精妙,经历了如此漫长的时间跨度以后,肯定都会积累巨量的改进需求。一成不变肯定会被时代淘汰,但放任让各家C语言编译器厂商自行改进,结果可能是出现一堆都自称是C语言但无法互通代码的C语言实例。

C语言早就看到了这个问题,早在1983年美国国家标准协会(ANSI)就成了专门的委员会来制定一个“无歧义的、与具体机器无关的C语言定义”,也就是C语言标准,通常称为“ANSI C”。ANSI C到目前为止发布了三个重要版本,分别是C89、C99和C11。1989年发布了第一版ANSI C,这就是C89。随后,C语言在C99和C11中又引入了一些新的功能和语言特性。目前最新的ANSI C是2018年发布的C17,不过并没有加入新的功能和语言特性,只是对C11进行补充完善。C2x是下一个ANSIC,又会给C语言带来一些新的特性,社区都特别期待,有消息说C2x可能就在2022年年内发布。

D. M.Ritchie老爷子已经在2011年去世了,但C语言并没有放慢进化的脚步,正不断通过更新ANSI C来变得更为现代化。前面提到说C++是C语言的plus升级版,这个说法流传很广,但其实并不十分准确。C++诞生于1979年,在那个时间节点上C++确实是C语言的plus升级版。但随着C语言自身也在不断演化,现代的C语言和C++的关系其实更像是一个藤上结出来的两个不同的瓜。ANSI C是前向兼容的,不过,想要享受C语言不断进化带来的便利,就要不断学习新的语法。

最后再次推荐学习C语言的书。K&R那本经典著作《C程序设计语言》是学习C语言的必读书,这本书和C语言的设计思路是一样的,用不太多的篇幅把重点都介绍了。很多人看完都说相见恨晚,早知道就应该先看《C程序设计语言》。

 
关于作者:
莫凡  ,网名木羊同学。娱乐向机器学习解说选手,《机器学习算法的数学解析与Python实现》作者,前沿技术发展观潮者,擅长高冷技术的“白菜化”解说,微信公众号“睡前机器学习”,个人知乎号“木羊”。
招募解读官

机械工业出版社华章分社招募解读官

解读C语言领域经典名著

享受C语言的独特魅力,分享收获

实现知识变现,打造个人IP


浏览 98
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报