通才智能体来了!DeepMind的Gato算世界第一个AGI吗?
新智元报道
新智元报道
编辑:David
【新智元导读】DeepMind最近大火的「通用智能体」Gato,算第一个AGI吗?不算,算通向AGI的一座「桥」。
由于最近DeepMind公司推出的Gato,人工通用智能(AGI)又成了热门话题。
一提AGI,人们就会想起电影《终结者》里的「天网」,它最初被设计为军队的威胁分析软件,但它很快就把人类视为敌人。
然而,Gato的出现似乎没有引起任何这种担忧。
这个深度学习Transformer模型被描述为一个 「通用智能体」,并声称可以执行604项不同的、多领域一般任务,这些任务具有不同的模式、观察和行动规范。
Gato被称为AI模型的「瑞士军刀」,显然比迄今为止开发的其他人工智能系统要通用得多,在这方面似乎向AGI迈出了一步。
Gato可以使用一组具有相同权重的单一神经网络,在广泛的环境中感知不同的体现并采取行动。Gato在604个不同的任务上接受了训练,这些任务具有不同的模式、观察和行动规范。
多模态神经网络,其实不新鲜了
多模态神经网络,其实不新鲜了
多模态系统并不新鲜。像GPT-3和其他系统都属于这种系统。
GPT-3旨在成为一个用于生成文本的大型语言模型。它还可以从标题中产生图像,生成编程代码和其他功能,这些都是事后出现的附加好处,往往令人工智能专家感到惊讶。
相比之下,Gato被有意设计为解决许多离散的功能。DeepMind解释说。
「具有相同权重的同一网络可以玩雅达利游戏、给图像加标题、聊天、用真正的机器人手臂堆积木等等,根据其上下文决定是否输出文本、关节扭力、按钮按压或其他Token。」
尽管DeepMind宣称,Gato在许多任务中的表现优于人类,但第一次迭代在一些活动中产生的结果并没有那么厉害。
观察家们指出,Gato在604项任务中的许多任务表现得并不特别好,一位观察家将其总结为。「一个AI程序,能做不少事,但很多事情都做得很一般」。
但这种说法忽略了问题的关键。到目前为止,只有 「狭义」人工智能 或 「弱人工智能」,也就是只擅长单一类别任务的AI。
比如,一个被设计用来开发啤酒配方的算法,它就不能玩视频游戏。
也就是说,一个算法「学到」的任何东西,都不能高效转移到针对不同特定目标的另一个算法上。
例如,同样来自DeepMind的神经网络AlphaGo,在围棋比赛中战胜了人类世界冠军,但它不会玩其他游戏,也不能满足任何其他需求,尽管其他游戏和围棋相比要简单得多。
什么是「强人工智能」?
什么是「强人工智能」?
「强人工智能」,或者说是AGI,是人工智能光谱的另一端。
它可以使一个单一的人工智能系统,也可能是一组彼此互联的系统,可以应用于任何任务或问题。与狭义的人工智能算法不同,通用人工智能获得的知识可以在系统组件之间共享和保留。
在一个AGI模型中,能够在围棋中击败世界顶尖高手的算法,将能够学习国际象棋或任何其他游戏,还能完成其他额外任务。AGI被设想为一个通用化的智能系统,可以像人类一样行动和思考。
伦敦帝国理工学院认知机器人学教授默里·沙纳汉(Murray Shanahan)认为,AGI 「在某种意义上和人类一样聪明,能够进行与人类相同水平的概括,并拥有人类所拥有的常识」。
与人类不同的是,AGI的执行速度堪比最快的计算机系统。
靠堆模型和参数,能堆出AGI吗?
靠堆模型和参数,能堆出AGI吗?
DeepMind的研究员Nando de Freitas认为Gato实际上是一个AGI标杆,只是缺乏通过进一步完善模型和增加计算能力所能实现的复杂性和规模。
Gato模型的规模相对较小,有11.8亿个参数,基本上是一个概念的证明,给未来的进一步扩展留下了很多上升空间。
扩展人工智能模型需要更多的数据和更多的计算能力来进行算法训练。我们在数据方面是很丰富的。
去年,行业分析公司IDC表示,「未来五年,全球的数字数据量将超过数字存储设备出现以来产生数据量的两倍。」
算力方面,尽管有证据表明,由于半导体物理尺寸的限制,算力的增长正在放缓,但过去几十年来一直呈指数级增长。
《华尔街日报》认为,在芯片制造商的推动下,我们已经找到了新方法来获得更多的算力提升。这主要是通过异构设计来实现的,即用各种专业模块构建芯片。
这种方法被证明是有效的,至少在短期内是如此,这将继续推动模型规模的进一步扩大。
多伦多大学教授杰弗里·辛顿(Geoffrey Hinton)是深度学习的先驱人物,他在谈到模型规模问题时表示。「大脑的一立方厘米内有一万亿个突触。如果有这样的AGI的话,[该系统]可能需要一万亿个突触。」
现在,这已经不再是天方夜谭。
一万亿以上参数的AI模型(参数相当于突触)的神经网络正在出现,谷歌已经开发了1.6万亿参数的超大模型。但是,这并不是AGI。
对GPT-3,旧金山的开发者和艺术家Arram Sabeti在推特上表示:「看GPT-3感觉就像看到了未来。已经让它写了歌曲、故事、新闻稿、吉他谱、采访、文章、技术手册。它太了不起了」
然而,人工智能深度学习怀疑论者Gary Marcus认为,「这说法存在严重漏洞」。他声称,其他人所研究的模型扩展,如预测句子中的下一个单词,「并不等同于真正的AGI所需的那种深度理解」。
Facebook的所有者Meta公司的首席AI科学家、图灵奖得主Yann LeCun在 Gato发布后的一篇博文中说,截至目前,还没有「AGI」这种东西。
此外,他还认为,即便进一步扩大模型的规模,也不能实现AGI,而是需要为现在的AI领域补充新概念。不过他承认,其中的一些概念,如广义自监督学习,「可能就在眼前了」。
MIT助理教授雅各布·安德烈亚斯认为,Gato可以同时做很多事情,但这并不等于它能够完成与所受训练内容不同的新任务。
虽然Gato可能不是AGI,但不可否认的是,它提供了一个超越「狭义AI」的重要过渡。Gato进一步证明了,我们正在进入一个黄昏地带,一个介于狭义和广义人工智能之间的不明确的区域。
参考资料:
https://venturebeat.com/2022/06/04/is-deepminds-gato-the-worlds-first-agi/
https://towardsdatascience.com/gpt-3-the-first-artificial-general-intelligence-b8d9b38557a1