浙大吴飞“舌战”阿里贾扬清:AI内卷与年薪百万,哪个才是真实?
共 6218字,需浏览 13分钟
·
2021-05-18 21:17
毫无疑问,人工智能又火了。
十四五规划提出,把科技自立自强作为国家发展的战略支撑,瞄准人工智能、量子信息、生物医药等前沿领域,实施一批具有前瞻性、战略性的国家重大科技项目。
人工智能将引领新一轮的技术变革与数智化浪潮,与此同时,外界对于人工智能的隐忧与质疑也从未中断。
哪一面,才是人工智能的真实?
为了推动 AI 技术的应用创新,促进人工智能领域的学术交流、人才培养,中国人工智能学会联合杭州市余杭区政府发起首届全球人工智能技术创新大赛,阿里云天池平台为本次大赛提供平台和算力支撑。
作为大赛的预热节目,“AI 青年说”近期邀请到浙江大学求是特聘教授、人工智能研究所所长吴飞与阿里云计算平台负责人贾扬清,交流人工智能技术与应用的发展趋势,更重要的是,聊聊“AI 内卷与年薪百万,哪个才是真实?”
(以下为对话节选)
吴飞: 我是 2009 年的时候开始对人工智能产生兴趣,当时我对自己的研究方向产生了深深的焦虑,觉得自己当时研究所写的东西 “面目可憎,言语无味”。这个时候,我得到去美国加州大学伯克利分校统计系郁彬教授课题组做访问学者的机会,深入学习很多有关机器学习模型理论和算法的知识。
原来在冰冷的机器后面,有这么多深奥的模型、算法和这么新鲜的理论来支持。一年之后,我回到浙大,从此走上了人工智能的学术道路。
贾扬清: 我最开始是学习自动化的。以前,我们开玩笑说,自动化主要做两件事情,一个是烧锅炉的,一个是开电梯的。
后来在研究生期间,我就对于人工智能和统计机器学习产生了更多的兴趣,当时人工智能并没有那么热,有一句流行的话,“人工智能是在 80% 的时间里,以 80% 的正确率,解决 80% 的问题。” 但是我们也不知道,那 80% 的时间解决了哪些 80% 的问题,大家一直处于相对低谷的状态。
2006 年的时候, Geoffrey Hinton 在《Science》发表了一篇讲受限玻尔兹曼机(restricted Boltzmann machine)的文章,我开始对人工神经网络等基础理论以及大规模训练产生兴趣。我是 2009 年去了加州大学伯克利分校,也有幸跟吴老师在伯克利相处了一年多的时间。
攻读博士期间,我们发现神经网络、深度学习的方法变得越来越重要,我们最开始从稀疏编码(Sparse Coding)等方面入手,构建一系列的软件栈以及相应的科学研究,来把基于深度学习的算法做得越来越好。
2012 年,AlexNet 的出现让全世界都突然意识到深度学习的重要,在此之前,2010 年左右,在语音领域 RNN 等方法已经开始被应用起来。当时我发现大家都在纷纷涌向深度学习算法,相应的软件工具平台却比较匮乏的,所以我们在伯克利就开始做 Caffe 以及后来一系列的深度学习框架。
在接下来的几年,我们见证了深度学习算法的大规模应用,无论是算法创新方面,还是方法的落地方面,都开始有了非常大的市场。
无论是阿里的城市大脑算法,还是达摩院的很多新型算法模型,很荣幸我的研究能够成为一个底座,支持大家在 AI 技术及应用上有进一步的创新和发展。
十四五规划把人工智能列为前沿科技领域的“最高优先级”。这对人工智能专业而言,意味着什么?
吴飞:2017 年,国务院公布了中国新一代人工智能发展规划,规划明确指出:人工智能是引领未来的战略性技术,必将推动人类社会和生活模式以及学习方式的巨大改变。
我想对年轻人而言,人工智能就意味着未来,因为它本身是一个使能技术,不断推动着社会的快速前进。规划还指出,高校要设置人工智能本科专业。2018 年,教育部批准了 35 所高校设置人工智能本科专业。到现在为止,全国一共有 345 所高校设置了人工智能本科专业。
图灵在 1949 年谈及图灵机时表示,“(图灵机模型的提出)这不过是将来之事的前奏,也是将来之事的影子。”
因此,对年轻人而言,无论是基础研究、关键核心技术的突破,还是赋能场景的实现,人工智能已经悄然地走进社会,像水和电一样的不断赋能社会的发展。
贾扬清: 在 2012 年以前,要做一个计算机视觉的识别系统,基本上就要去读一个博士,才能做出来,而且效果还不一定好。今天我们发现,从 0 到 1 的积累差不多已经完成了,或者说已经比较成熟。算法的标准化和应用化会变成趋势。
今天如果我想做一个无人驾驶的 demo,就并不需要去学计算机视觉的博士。因为今天有非常多开源的模型,让我们能够非常迅速地把算法能力给补齐。算法的标准化、工程化,以及怎样迅速地把标准算法和特定的业务场景结合起来,是我们今天在计算机视觉、语音、自然语言理解等领域的大趋势。
当然科研还在继续往前走,我们在寻找新的高精尖方向。但同时我认为,怎样把现有结果大规模应用到不同场景中去,是一个非常大的趋势。
另外,我们会发现,以前单纯的垂直场景,比如像计算机视觉、语音、自然语言处理等已经开始逐渐融合,变得共通,这就需要用到大规模、多模态模型。如我们所见,谷歌、OpenAI、DeepMind 等公司都在这方面做出非常多的探索。
前段时间 OpenAI 推出 GPT-3 模型,这带来的启发是:我们需要有一个通用、多模态的模型,来统一理解各种形态的数据和各种形态的输入。
我觉得这代表了另外一个趋势。一方面是现有结果的工程化和规模化,另一方面是各子领域之间的相互贯通,以及做到更加深入、更加本质的理解。
吴飞: 我补充一下,有两个方向的趋势值得关注。
第一个是从 0 到 1,按照朱松纯教授的说法,现在的机器智能是“大数据小任务”,比如 GPT-3 有 1750 亿的参数,并且使用上千 GB 的训练数据把它训练出来。 但如何让人工智能或机器智能具有人脑小样本学习的能力、动物的直觉能力以及举一反三的能力,这是我们面临的巨大挑战。
第二个我觉得是从 1 到 N,人工智能已经是一门使能技术。就像我们徐匡迪院士所言,“人工智能需要数学家参与进来。”
人工智能取得突破性的领域方向,一定是从脑科学、材料学等领域得到了启发,所以 AI 接下来的突破,一定是基于大数据、多学科交叉下的领域突破。
贾扬清:我也补充一点。今天的人工智能系统,特别是在感知领域,无论是计算机视觉还是语音,都存在一种“一揽子买卖”的状态。 例如有一个输入和一个输出,标注是人或者车,这就是一个所谓的“one shot”过程,目标集有时是手工指定的。
怎样从单点的目标或者单点的预测(prediction)到更加完整的知识体系,即所谓的大知识。正如吴老师刚提到的“大数据小任务”,“大数据大知识”是我们今天需要打通的一件事情:在简单标签的基础上再构建一个知识体系,无论是逻辑关系还是其他关系。
传统的专家系统,更多的是通过人工手写的方式来做的,很难规模化。传统的机器学习方法还是小任务单点预测的状态。怎样能够让机器学习系统更加自动、规模化地生成结构化的知识和结构化的体系,我觉得,在接下来几年,这方面可能产生最大的突破,或者至少是需求最大的方面。
同时它也引出了另外一点,就是吴老师刚才提到的:人工智能怎样赋能行业,例如制药业的数据是非常少的,对于逻辑推理和知识抽象的要求非常高。因为它没有办法像图像识别一样能使用几百万张图片作为数据。
简而言之,未来有两个趋势:一个是从大数据到大知识,另一个是怎样通过抽象出来的知识体系,来赋能其他领域,以更好地使用 AI 技术。
吴飞: 发展人工智能一定要有丰沃的土壤,也就是人工智能发展的生态。今天要支撑起中国人工智能的发展,一定要依靠底层的算力、底层的软硬件以及中间算法和上层的应用软件。从底到高支撑起中国人工智能的发展,就是它的技术生态。
可能是之前我们忙于搞模型、搞算法、搞应用。而现在已经到了一个关口,需要阿里巴巴等企业的投入,需要浙江大学、清华大学、北京大学等高校的投入,需要政府的关切以及各行各业人才的投入,同频共振、相向而行,建设一个良好的生态。
贾扬清: 今天谈论得非常不足的一点是,怎样让所有人都能用到人工智能的技术。
此前我们更关注的是怎样发展高精尖的技术。纵观历史,我们说人工智能是通用化的技术,或者我们相信未来它将是技术发展的核心点,这就需要让所有人都能更容易地接触到人工智能。
几十年前,英语专业有一个专门的职业叫翻译,而在国际化的影响下,如今很多人自身就能掌握中英双语。我们以前说:“计算机要从娃娃抓起。”而今天我们几乎每个人都有使用计算机或操作计算机的能力,无论是电脑还是手机。只有达到这种普惠程度的时候,我们才能够把一个技术称为通用的、普惠的技术。
今天人们要触达 AI 技术还是相对困难的。无论是在硬件上(搭一个带有 GPU 的机器),还是在软件上(安装一套人工智能框架以及底层数据的软件等),都还比较困难。
设想一下,如果任何一个懂电脑的人都可以在 5 秒钟之内开始尝试写 AI 算法的代码,并且很快能识别一张图像的内容。他也许并不懂底层的技术是怎样实现的,但创造性的火花很容易就此迸发。
高精尖的技术往往是比较抓眼球,容易被大家接受。而从长远角度看,这种潜移默化的普惠化、润物细无声的过程会收获更好的效果。
贾扬清: 学习人工智能与是否读博的关系并不是很大,每一个行业都会对博士有特别定义。在 AI 领域有非常多优秀的本科生和硕士生,他们并不比博士的能力差。
从个人经历来看,我的博士生涯教会我的最重要一点不是“怎样做一件事情”,而是让我更多地思考“我们应该解决什么样的问题”。
博士更多的是要定义问题,需要从特别复杂的场景中抽象出要解决的问题的定义。然后第二位的才是「怎样解决这个问题」,这是博士生涯对我帮助最大的一点。
从培养的角度讲,如果大家希望培养一下自己定义问题的能力,我觉得博士还是很值得读的。5 年的时间不长也不短,但能力的提升是终身获益的事。
吴飞: 我完全同意扬清的观点。读博的问题要辩证看待。 如果同学们渴望充电,有渴望学习的饥饿感,通过职业培训或者通过工作环境中的积累无法解决,那就去读博士。并且读博期间一定要注意,学习目的不只是获得文凭,也不只是发表文章,而是为了培养能力。
刚才扬清也讲了,这是一个终身的事情,人们常说读完博士之后,他能不能发展好要再看 5 年,5 年之后如果继续往前发展,就说明他已经走上了人生不断向前发展的轨道。
贾扬清: 这个问题没有非黑即白的答案。首先,现在国际交流越来越多,线上会议只有时差问题,就像看世界杯一样,出国可能没有 10 年前或 20 年前那么必要了。
另一方面,我一直相信不同文化、不同思想的融会贯通是创造新的思想和方法的丰沃土壤。如果有机会的话,我也建议大家出国去看一看,无论是参加一个学术会议,还是访学计划,或者投资更长的时间去读博。更加重要的是,从自己出发,打开心扉,去了解不同的文化与技术氛围。
吴飞: 我是 2009 年 10 月份从北京首都机场出发,飞往美国旧金山。当时我已经 36 岁了,那是我第一次出国。在伯克利的时光,我基本是两点一线,从宿舍到伯克利的实验室。一年到头,我只有春节期间休息了几天,记得除夕约了扬清吃了顿饺子,那也是我没去实验室的仅有的一两天。
很多人都有出国的经历,但并不是所有出国的人都抓住了机会,也并不是每个人都能完成自己的志向。在美国高水平的大学里,如果能够把自己全部的精力都用于学习,是非常好的人生体验。
从伯克利回来之后,我的大脑里面会经常浮想起美国西海岸蔚蓝的天空以及宿舍夜里火车经过的鸣笛声。这不是在回忆美国的生活,而是在回忆当时的奋斗。
贾扬清: 内卷是一个很有意思的概念,包括大家逛知乎常看到一个词语,叫调参侠。
在 AI 领域,有很多创新的事情可以做。内卷与否,是我们自己内心的表现。如果觉得自己做不出新的东西,只能调调参数,做一些增量工作,这肯定是内卷的。
容易的地方就会内卷的,难的领域往往会有突破。
应该给自己更多的信心与勇气。AI 已经是个日新月异的领域了,广泛应用到互联网、交通、电力、航空等领域,每年都有新的突破,何不去做创新呢。
吴飞:扬清有意避开了“年薪百万不是梦”,但对高校老师而言“年薪百万就是梦”。教师的工资明显没有学生高,这是人工智能领域的实际情况。我们培养了很多的学生,现在已是年薪百万。这说明人工智能专业的职业发展前景非常好。
未来的发展趋势不会改变,整个国家把人工智能作为一种战略性技术进行发展的大方针不变,各行各业都会对人工智能有极大热情。
为什么会内卷,是因为大家都跑到一条赛道上去了,比如都挤到“大数据小任务”的赛道,变成了所谓的“调参侠”。于是没人做农业、司法、环境等更具开创性的场景应用,就发生了内卷。
想象一下,你读完人工智能的博士或者研究生,如果进入一个稀缺人工智能的行业,那么你就是这个行业的 AI 之王,哪里会有内卷。
贾扬清:我也顺便谈下“年薪百万”这个事。像我今天早餐是自己做的,午饭是在食堂解决的,平时真的花不了多少。其实真让自己开心的事并不是年薪百万,而是我们做的东西有人用,大家都喜欢。我特别崇敬吴老师这些学校里面的老师。第一,他们在探索前沿研究;第二,他们在培养 AI 以及各个技术领域的人才。
吴飞: 中国人工智能学会从为国家培养人才的角度来举办大赛,赛题也来自于产业界的需求,这非常好。人工智能最贵重的一点就是贵其能用,赋能社会,每个赛题都来自产业的需求。同学们用在高校学习得到的知识和技术,来解决产业的问题,就打破了学科的壁垒,达到产教融合的效果。同学借此了解到业界解决问题的一些方法与思路,相信以后回到高校,可以更高屋建瓴地看待学习的内容。所以全球人工智能技术创新大赛是高等学校和产业界携手,面向人工智能应用进行人才培养的好方式。
贾扬清: 竞赛一直是推动创新的好机制,以前在读书的时候有挑战杯这样的比赛,这对我们在课程之外尝试一些新的东西是非常有用的。比如 Facebook 等公司也有黑客马拉松的机制,某程度上可以让大家跳出本职工作,尝试新的点子,产出新的技术或者产品。借着吴老师刚才说的“随心所欲,随遇而安”,我觉得这个比赛大家可以“生死看淡,不服就干”。相信大家都能够从比赛中体会到快乐,收获到知识。
推荐阅读: