李德毅院士《探索新一代人工智能产业发展》
来源:图灵人工智能
中国工程院院士、CAAI名誉理事长、主线科技首席科学家李德毅作为大会嘉宾登台发表重磅演讲:《探索新一代人工智能产业发展》,就新一代人工智能的发展历史、产业现状、突破核心以及智能时代的中国方案发表了精彩观点。
以下为李德毅院士演讲实录。
今天,我们很高兴能在这里见证历史,也创造历史。第一个创新中心(新一代人工智能物流创新中心)在这里成立,第一个干线物流项目(中国首个干线物流自动驾驶商业项目)要在这里正式启动。
我今天想讲一讲,在当前人工智能产业如火如荼、甚至有一些疯狂的背景下,我做的一些冷思考,我报告的题目是《探索新一代人工智能产业发展》,有一个很重要的副标题是《智能时代的中国方案》。
我们先讲一讲当前的形势:
新一代人工智能如何从传统人工智能中脱颖而出?
其实人工智能比我们想像得要难,甚至要难得多。现在各个学校,各个学会,各个地区都在开人工智能大会,我个人认为要认真地想一想当前中国的现状。我写了一首诗描述它:“基础研究弱”,因为我们中国拿到图灵奖的只有姚期智院士,当时在美国取得的,我们中国人在中国国土上还没拿到过图灵奖;“辐射市场大”,人人都在喝人工智能的汤,这个汤很好喝;“叶茂枝不壮,树大根不深,叫好难叫座”,我们参加无人驾驶的比赛已经十多年了,每次都有老百姓不看好,说为什么还有一个安全员呀?为什么人家不投资啊?叫好的人多,出钱的人少,所以这就反应了当年真实的情况。
尤其重要的是,中国人提出一个新一代(人工智能),我们只知道人工智能有寒冬,有春天哪怕有夏天,那么“新一代人工智能”是什么意思?中间的分界点在哪里?以前的传统人工智能叫什么名字?后面新一代人工智能的技术特征是什么呀?
如果我们对这几个问题回答不清楚,我们在忽悠谁呢?在忽悠自己吗?那是绝对不允许的。所以这里我做了一个定义:传统人工智能,我把它叫做计算机智能,凡是在计算机上完成的智能都是计算机科学的应用;新一代人工智能,按照国家的希望,要做一个类脑的智能。这个想法当然很好,但脑科学现在到了什么程度呢?我们做得出来吗?如果说新一代人工智能和传统人工智能之间有一个分界点,那么这个分界点是什么重大事件呢?本人认为是2016年的围棋程序(Alpha Go),它是以深度学习为基础的人工智能,使得全世界对人工智能刮目相看。
因此这张图表就告诉我们一个基本的标签,新一代人工智能是什么?传统人工智能是什么?分界点在哪里。现在做的最好的是GPT-3,人工智能的高峰,做自然语言处理的,使用1750亿个参数,通过深度学习来做预训练、预编程的人工智能。那么类脑、类人的人工智能应该是什么呢?我认为既然是新一代,就不应该只是小的改进,因此我们应该做自学习、会编程的人工智能。我们不能把软件工程师的编码当作是机器的智能,计算机只是在重复这些编码而已,真正的“智能”是算法工程师的编码,一定要自编程、会学习才行。
没有类鸟,人类发明了飞机,反过来用空气动力学解释了鸟的滑翔。其实,鸟在空气中的很多复杂动作,科学解释不了,所以我们的飞机的翅膀是不动的,学的是鸟的滑翔;没有类脑,人类发明了计算机,反过来用计算机解释了人脑的部分智能。因此,我个人认为类脑、类人的智能之路还很长很长,如果按照智人在进化过程中七万年的历史作为对比,我们花一百年、三百年来做这件事也不算慢。
类脑的方法千万种,我们该如何入手呢?我个人认为受脑科学和认知科学启发的人工智能比较靠谱。我们说的类脑智能实际上是脑科学和认知科学启发的人工智能,尤其是认知科学,它的历史已经一百多年了。我们要剥离意识,不要做人工生命。这个新冠病毒告诉我们,病毒还不是一个完全的生命,它还有一个宿主的概念,但却已经把我们人类搞得很狼狈了,所以千万不要搞一个人类的异己当作新型人类,我们就做人脑的、智能的体外延伸,它是个工具,在物理装置上外显人类智能,研发智能机器。我们今天这个干线物流自动驾驶项目就是做这个的(智能机器)。
如果从70多年的人工智能发展历史来看,大概有三个学派,我们稍微回顾一下它们的共性和局限。行为主义学派就是机器人学派,他们希望机器像人一样行动,于是他们发明了从感知到行为的机器人行为智能;符号主义学派,那我本人应该就是这个学派的粉丝吧,符号主义学派希望把一个计算问题变成一个推理问题,要做可解释,让机械像人一样思考;已经火了较长一段时间的连接主义学派,他们希望机器脑能像人脑一样连接,于是就有了2000年开始的机器学习,2006年开始的深度学习也是机器学习的一种特殊形态。
因此,我们强调行为主义的方法有重要的两条,一个是模仿,一个是类比,我们把它拓展为感知智能和行为智能。计算智能,我们当然要发扬,而连接主义的方法,我这里提出了一个新的概念叫做记忆智能,不仅仅是计算。因此在我的字典里有三个智能:感知智能、认知智能和行为智能,感知智能和认知智能也可以叫做交互智能,行为智能、认知智能里边则有计算智能和记忆智能。
为了把这个问题说清楚,我自己做了一张片子。假如现在有个盲人,他带了一个机器导盲犬,他要走出这个交通枢纽,这个机器导盲犬当然是带摄像头了,它就通过摄像头看哪个出口是我们要出去的呢?它看到了一个B字,又瞄到了C字,很快就确认这是C出口,所以另一个是B出口,然后机器导盲犬一次规划,二次规划就可以从B出口走出去了。但是,如果把这个C标签换成14,这个机器导盲犬就会发现那个字不是B,而是13。所以这个B字是带有不确定性的,横过来看是B,竖过来看是13,这就叫做情境不同。为什么我们要有落地场景?就是要看情境。在不同的情境里,B字代表着不同的语义。
所以,我提出来重要的四个单词:语境、语用、语义、语法。计算机看很多的语法就是算法,看很多语义就是文字。我们不但看这两个,还要看更重要的两个:语境和语用。所以关于新一代人工智能,我提了八个字叫“各智其智,智智与共”。
计算机诞生于符号处理,类似人的高阶认知,我们被困在计算机太久太久了,我们总是在想计算快一点,再快一点,但是计算就是人类智能吗?人类智能是在和环境交互中进化的,过了几万年了,先有感知,先有行为,先有具身智能,先低阶后高阶,具身产生感知智能和行为智能,高阶认知产生记忆智能和计算智能。
因此,新一代人工智能一定要另辟蹊径,来实现更大更快的突破,这才叫勇闯无人区。新一代人工智能必须有质的跃升:从计算智能扩展到记忆智能,从人机交互扩展到交互认知,从深度学习扩展到机器自学习、自编程。我认为“各智其智,智智与共”,才是新一代人工智能的研究方向!
人类正在进入智能时代,我们的卡车,我们的汽车,我们的动能机器正在被人工智能润物无声地渗透进去。各式各样的智能代理或者智能机器正在成为人类智能的体外延伸,智能驾驶无处不在,无时不在。
会学习是新一代人工智能的核心
那么,新一代人工智能的核心是什么?我认为是会学习。什么叫会学习?英文叫做“Learning to learn”。一个好的老师,只教学生知识吗?不对,不但要教他知识,还要教他怎样使用知识,这叫高阶学习。那么如何学习?
学习:物理空间和认知空间的交互
人在与环境的交互中,形成物理空间位置感,通过跨模态感知,很多人都说多模态,但我个人觉得跨模态更好,视觉和听觉是双模态,将这两个交叉起来,才能将物体看得更清晰,把物理空间要解决的现实问题转换到认知空间,在认知空间不同记忆区留下带时间印记的抽象,可以从长期记忆区直接提取问题解决方案,也可以在工作记忆区进行计算、思考或推理,形成问题解决方案,然后通过智能行为作用到物理空间,形成感知-认知-行为环。交互中的空间智能,以及现实空间 (外在的宇宙) 和虚拟空间 (内在的宇宙) 不停地相互映射,是人类智能基本的能力。
学习:不刻意区分通用智能和专用智能
人类模仿学习早在语言文字之前就有了,不要小看模仿,人类发明文字就是模仿,特别是中国的象形字。模仿培养了注意力选择,培养了人的想象力和类比力,形象而生动,模仿、联想和简约是可以跨领域使用的通用智能,体现创造力。模仿有两个重要的创造因素,一个是抽象,一个是类比。常识就是特定人群的共识,不言而喻,可以缺省。至于是通用智能还是专用智能,常识还是非常识,仅仅是相对的,没有必要刻意区分。
现在大家崇拜的围棋程序(Alpha Go),它固然可以把人类围棋冠军打败,但是今天如果我们突然不下19x19(棋盘)的围棋了,改下19x9的长方形棋盘了,那这时围棋程序就变菜了,而人类棋手依然可以下得风生水起。这就是说明,在通用智能里边有相互的专用,在专用智能里也有相互的通用。
通过学习让机器自编程自成长
当前,我们用机器来说话,用机器来做自然语言翻译,符不符合科学的基本原理呢?我们可以想一想,计算机主要是靠语言实现的,计算机语言主要是靠数学来描述的。那么哪一类最高等的数学论文有没有用自然语言来帮忙的呢?因此,现在用计算机来解决自然语言,是不是掉进了哥德尔不完备定理的坑里?
因此,我认为,我们要强调学习是新一代人工智能的核心,不只是解决预设同类问题的能力。无人车无论是在比赛中,还是在现实的公路上遇到的事故,常常都是无法预料的事故,我们有个比喻叫做哪壶不开提哪壶,无人车真正碰到的事故,在之前的测试数据库中是找不到的。所以不能只能解决预设的同类问题,而是经过学习,可具有解释解决未曾料想的新问题的能力。具不具有通用的智能,体现在能不能随时针对一个跨领域的现实问题,生成新的记忆边界,完成推理。
因此,我们新一代人工智能物流创新中心应该研发有感知、有认知、有行为、可交互、会学习、自成长的新一代智能机器,我们希望创新中心要把这个事情做好,而不是在计算机里面忙着编码,只是重复软件工程师的编码。
人工智能产业,既是自成产业,更是赋能产业。如果自身没有硬核,难以赋能,难以形成规模经济。传统人工智能——计算机智能的硬核是什么呢?是算力、数据和算法,传统人工智能的这碗汤,大家喝了还是觉得有滋有味的。
但是对于我们新一代人工智能物流创新中心来说,我们的目标应该朝向2056年,人工智能发展100年的时候,我们要形成新一代人工智能的三个硬核:交互、学习和记忆,那这碗“AI+”的汤的滋味就更浓了,将赋能各行各业,形成真正的亿万级规模的经济,这就是我们今天在这里成立创新中心的意义所在。
智能时代的中国方案
那么,中国的方案到2056年该是什么样子呢?我个人认为智能驾驶是智能代理和智能机器的典型代表,它改变“游戏规则”,重塑未来产业格局,改变人们的生产生活方式,决定一些企业组织的生死存亡,影响世界强国更替兴衰,推动人类文明演进发展。这段话不是我编的,是我们中国工程院给国务院的报告中阐述“智能驾驶为什么是颠覆性技术”的一段话。但是,当前的问题是人们对智能驾驶的长远作用认识不足,对产业化难度认识不足,对近期效果期望过高。谁不希望无人车里没有那个安全员呢?但是发生事故怎么办呢?至少得有个云代驾吧,所以这三个事情我们要反复地说清楚。
我们希望未来汽车是有感知、有认知、有行为、可交互、会学习、自成长的新一代轮式机器人。我在《中国科学》上已经发表了两篇文章,一个就是讲的可交互的轮式机器人,一个就是讲的会学习的轮式机器人,现在正在写第三篇叫自成长的轮式机器人,希望大家回去可以查查前两篇。
这个自动驾驶技术的问题是涉及到人命安全的大事,所以按照常规的颠覆性技术发展的三个时期划分,共有三个时期,一个是科研探索期,解决从0到1的问题;然后是市场创新期,解决从1到10的问题;最后是规模发展期,解决从10到10的N次方的问题。如果说从1985年到2020年的35年中,我们已经走过了科研探索期,那么对于我们新一代人工智能(无人驾驶)而言,从2020年到2030年的这十年将非常关键,无人驾驶要孵化产品,并且被社会接受。
现在,全球一共有多少辆车呢?到2035年,全球又有多少辆车是无人驾驶的呢?我个人做了一个非常乐观的思考,预测大概有4.4亿辆前装量产的无人驾驶车。我想今天汽车厂商听了甚至会摇头,说生产不出这么多。那现在全世界一共有多少车呢?包括特种车、救护车、卡车等等,只要带轮子的都算,全世界有18亿辆车。我想,如果实现了无人驾驶,全世界的车就可以不用再增加数量了,将来或许都不需要18亿辆车。
那么在中国,我们的新一代人工智能要怎么样为这张图做贡献呢?我想要讲一讲产业化的四个要素:技术、生态、成本和市场。我想讲一讲两条曲线,一条叫社会接受度曲线,告诉我们什么时候有多少人买这个车,什么时候这个车可以达到多少辆,这个曲线还是是很厉害的。还有一条是社会关注度曲线,可以看到无人驾驶关注度的最高峰已经过去了,现在正在慢慢地回落,人们正在慢慢地开始接受了。所以今天,我围绕这两条曲线来讲一讲中国的新一代人工智能到人工智能发展一百年的时候,在智能驾驶领域上是怎么来表现的。
举个例子,咱们看看特斯拉。特斯拉在营销和产业化上很清楚,先造一款价格高昂的跑车,再用赚到的钱造价格相对低的车,再用赚到的钱造价格亲民的车,以后提供太阳能自动驾驶车。
那我们中国的无人驾驶车应该制定什么样的发展图景呢?2020年到2030年,既是全球智能驾驶最重要的市场创新期、产品孵化期,也是自动驾驶的社会接受期。现在很多人都已经很疲劳了,但我希望他们可以继续坚持一下,恰逢我国制定“十四五“发展规划和2035年远景目标,正是中国的机遇。这十年,对我国智能驾驶、智能制造乃至人工智能占领全球高地,举足轻重。2020年的时候,我国有3.6亿辆机动车保有量,其中汽车是2.7亿辆。我们希望到2035年,前装量产的无人驾驶车要达到1亿辆,在座的汽车厂商同志与投资人同志,想一想这是非常雄心壮志的目标。
决定智能驾驶影响力的不仅仅是技术,一定要随着应用场景落地的深化,加速技术的迭代和新的创新。一个驾驶脑要迭代多少次呢?不是100次,而是要经过1000次,才能经得起摔打。
因此在孵化期的前五年是非常重要的,我们要通过有趣的技术,谨慎地选择落地场景,先用于特种车或者商用车,而不是你家的小轿车,我们要吸引创新者或早期的创业者。
我个人认为2020年到2025年的孵化期有四大场景。那我们今天就有第一大赛道:卡车物流赛道,可以落地到干线物流、港口还有矿山场景;乘用车赛道先解决自动泊车问题,然后解决快速公交和普通公交的问题,最后解决Robo Taxi的问题;农机赛道解决拖拉机无人驾驶的问题;低速电动车赛道,解决无人配送、环卫、园区通勤的问题。所以我认为产业化就这四条路,大家抓住了往前走,就能起到榜样作用。
其中,在自动驾驶卡车赛道,我们以港口无人水平运输带动自动驾驶卡车落地;农机赛道,我在农业大会上提出来要把无人驾驶拖拉机作为智慧农业的起跑线;乘用车赛道,先把自动泊车做好,不管是室内还是露天的停车场;低速电动车赛道,率先实现无人配送规模化应用。
孵化期的后五年,2025年到2030年是什么样子呢?我们做的一个估计,自动驾驶从有趣向有用跨越,开始被早期采用者所接受。产业链配套形成、可规模化扩展、提供精准化管理和市场化服务,产品开始快速迭代升级,十大赛道全面铺开,从示范走向普及。智能网联汽车生产超过一千万辆。我们主线科技现在已经做了100辆自动驾驶卡车了,现在正在做一个千辆和万辆规模的计划,这个还是很务实地一步步在往前走的,不是说大话的。我们希望大部分城市的BRT公交能实现自动驾驶,宇通刚刚在郑州宣布了一条BRT的自动驾驶路线,要是全国大中型城市都实现自动驾驶公交了,那么老百姓的幸福获得感就更强了。将自动驾驶技术普遍推广于特种车和商用车,然后迅速向私家车和小轿车普及,做一些老百姓消费得起的时尚的小车子。
到2030年至2035年大规模发展的前五年,我们有了不再是软件定义的汽车,更不是四个轮子上加个计算机,而是具备学习能力的智能驾驶车,包括试错学习和向事故学习,不仅有计算智能,还有交互智能和记忆智能,可以自学习,自成长。
到2035年至45年的时候,我们希望智能驾驶车辆之间自然交互,能够突破各种问题,突破各种地理栅栏、天气栅栏和人文地俗栅栏。车群具有灵活编队模式,形成新的交通文化和社会生态,到那个时候,人工驾驶的门坎反而提升了,一般人做不到了。
中国智能网联生态,目前应该是有条件领先全球的,尤其是我们北斗和车联网。等到人工智能一百年的时候,国内罕见人工驾驶,智能驾驶就像我们现在基础设施——高铁一样,在全世界都是领先的。因此,可交互会学习自成长的轮式机器人及其编队,可望实现全国范围内的交通全覆盖。所以,人工智能一百年的时候,我们有没有可能向全世界给出一张继高铁之后的很好的答卷?那这个答卷就应该是智能驾驶。
智能驾驶有望成为我国继高铁之后的又一张崭新名片,它表现在:
智能车载平台有望提升我国整个智能制造业;
北斗+ 4/5G 成为智能网联的中国特色生态;
农机智能驾驶成为我国智慧农业的起跑线;
公交智能驾驶使老百姓有实实在在的获得感;
以港口枢纽和高速干线物流为代表的新一代人工智能物流网络;
交互、学习和记忆成为新一代人工智能的硬核;
以港口枢纽和高速干线物流为代表的新一代人工智能物流网络
最后总结一下,如果自动驾驶车辆的行为和人类驾驶员有区别的话,行人不会同意一辆自主机器人在他们身边开过。有人驾驶车和无人驾驶车之间的行为互动,将成为我们生活中的常态。智能驾驶最有意义的成果告诉人们,社会终将在没有明确规定的情况下,就是我们所说的L5级自动驾驶,物理机器与人进行互动,随着智能润物细无声地向动能渗透,为创造与人类公开互动的智能机器创造了机会,为机器人接受学校等各类场所的传承学习创造了机会,也为用较少的人监督遥控更多的动能机器在各类农场、港口、矿山、工厂、交通运输、旅店、家庭、写字楼等为人类不知疲倦地劳作创造了机会,人类就真的进入到了智能时代,谢谢大家!