游戏引擎,为人工智能的探索提供了新的可能|无学科专栏
共 3272字,需浏览 7分钟
·
2021-03-14 19:42
本文选自MIT《设计与科学杂志第五刊》。作者是米歇尔·埃勒,一名交互设计师与人工智能研究工作者。
文章导读:
人们对人工智能总会产生两个误解,第一个是,人类与人工智能的关系是相互对立与替代。第二个是,人工智能的发展目标是,长得像人,有人性、自主、独立,有像人一样的智能。但真实的人工智能领域发展不是这样。
那究竟什么是智能?
人是智能,那一群能够选择最优路径的蚂蚁是智能吗?
随着地球生态环境不断适应的自然系统是智能吗?
这些争论没有结论,但科研者们根据这些探索到了蚁群算法、遗传进化算法……这为人工智能领域带来的思考是,智能是多元的,人工智能也是多元的。
如今游戏引擎和游戏,为人工智能的探索提供了新可能性。
(译文)
有人会觉得,我们的人工智能形象是由大众文化塑造的。因为电影中的AI形象,本质上就是拟人化的形象:会说话的汽车,想要成为男孩的机器人,比人类更像人类的复制品。
在过去的几十年中,流行文化已将人工智能的形象塑造为具有人性,且独立、自主。但实际上,真实的人工智能发展情况恰恰相反。
人工智能和人类,是智慧生态系统的一部分。智能之间的关系不是二元对立,不是非黑即白,而是更多的频谱。一只蚂蚁本身并不聪明,然而,一群蚂蚁想出如何以最有效的方式在一定距离内运输树叶的方法,被称为集体智慧。
几千年来一直在适应气候变化的生态系统,可以描述为某种缓慢的智慧。
智慧有许多不同的形式、规模和速度。
但如今的科研领域缺乏适当的方式理解这种新形式的智慧,也缺少记录、积累各种智慧状态的适当方法。AI 在小说中的表现,几乎无法代表该人工智能的发展路径,但另一种流行文化媒介——游戏,却扩大了我们对AI的理解的潜力。
简单总结:视频游戏和游戏引擎,为网络式AI提供了新的可能。
揭开AI的神秘面纱
当普通用户与某种形式的人工智能进行交互时,在交互过程中经常会有三个标志性的黑箱:网络化模块化架构、分布式、时间和学习。而这些都将在游戏的媒介中展开。
拼接智能:细分思维
2017年夏天,巴拉克·奥巴马(Barack Obama)的一支视频传播开来。
最初看起来像前总统的普通录像,实际上是这是由华盛顿大学研究人员设计的算法生成的一支完全伪造的视频。视频的口语内容取自奥巴马之前的一项录音。他的嘴唇动作是人工生成的,并通过一种算法同步到音频文件,因此无法区分真实和虚构。
蒙特利尔学习算法研究所的研究人员走得更远,创建了一个名为 ObamaNet 的程序。他们的工具无需依赖实际的口语单词,可以直接从文本创建自己的音频文件,然后将其用于生成奥巴马的嘴唇运动。
这是如今的一个 AI 研究方向,从将整体图像处理进入到部分图像的处理,再从文本文件生成低分辨率以假乱真的视频。
这些AI实验在技术复杂性上是很高的,同时在它潜在的影响也令人毛骨悚然。
我们是怎么来到这里的?
是谁将文本到深度模拟视为要解决的关键问题,从而花费大量的科研能力去研究?
从机器学习的历史来看,很长一段时间来,AI 社区已经进行了很多关于转译文字和视频的尝试。例如,语音识别研究可以追溯到1970年代,当时DARPA资助了一项为期五年的语音理解研究计划。
在1990年代,第一个商业语音转文本软件问世。文本到语音,语音到文本,文本到图像,图像到文本,声音到图像,图像到声音,2d到3d,3d到2d等-机器学习社区似乎已经对翻译产生了痴迷。
这些规范式的挑战,似乎是研究人员相互竞争的量化方式。这样的发展模式可以简单描述为:如果不能直接从A转换为C,则将问题分解为子问题,从A转换为B,然后从B转换为C。高度专业化,带来越来越小的 AI 拼贴。
众多子 AI 模块化的拼凑“智能”,同样也体现在物理世界中。
平均每个智能手机包含20个或更多传感器,仅我们的智能手机就构成了一个跨地域的传感器网络,可以收集来自数百万用户的数据。这种行星级的传感器和计算机网络,收集和处理的数据基本上没有其他映射,也就是说,公众并不知道其绝对规模。
2015年 詹妮弗·加布里斯(Jennifer Gabrys),Goldsmiths 大学的社会学教授,在她的书《计划地球:环境传感技术与计算行星的制造》中提到了哲学家吉尔伯特·西蒙登(Gilbert Simondon)的 “信息化” (理性处理和体验行为)概念:产生信息的过程,也是形成经验的一种方式。
《计划地球:环境传感技术与计算行星的制造》
詹妮弗·加布里斯认为,时刻监视着我们的感知网络,不仅可以得出理性的见解,还可以让我们从多个角度体验我们的世界。这些体验使我们能够通过非直接的联系与其他实体进行交流,从而影响生物进化和人类进步的环境,也能看到新型的模式。
类似地,人工智能系统就其训练目的而言,也是具有世界意义的。它们也使世界不再是单一叙事,而是更加多元的叙事。
由于大多数 AI 系统是由更小,更专业的子AI构成的,而每个子 AI 又因为数据和算法不同,有自己独特的抽象理解方式。这些过程非常复杂,多层、且自给自足。这与我们日常生活的理解方式差距很大。这时,游戏引擎所制作的软件可以成为界面,用可视化的方式,展现和交互这些大规模的空间传感器和信息网络。
从棋盘游戏到自动驾驶汽车
—— 培训游戏
我们将视角变窄,关注游戏、模拟、策略、预测以及人工智能的发展史,以此来展示游戏和游戏引擎与AI的联系性。
从 Kriegsspiel 到 AlphaGo
今天的计算机模拟的起源可以追溯到普鲁士游戏《克格里斯派尔(Prussian kriegsspiel)》,这是由一名叫乔治·赖斯维茨的中尉开发的棋盘游戏。
普鲁士游戏
普鲁士军队在19世纪初开始使用它。这个游戏是模拟两支小型部队,在由网格系统制成的象棋一样的战场上作战。对于普鲁士军队来说,这是一种简单、直观、好玩的模拟方式。
随着时间的推移,游戏规则也逐渐复杂,一系列真实因素被添加到游戏中:三维地形、马的速度、不可预见的事件(例如突然的通讯困难)、随机因素(例如天气状况)和未知因素(例如对手的军队实际规模,长处和短处)。后来一位叫做朱丽叶的将军让规则更加灵活,并增加游戏监督员,从而进一步完善了模拟真实战争的想法。之后战争游戏的概念已成为普鲁士军官常用的工具,并在20世纪开始被其他国家学习和完善。
20世纪后期,技术发展让计算机辅助的军事模拟开始大行其道,这些游戏的细节和准确性达到了新的高度。
从那时起,模拟情景这种最小化风险,并检验战略优势的方式,也逐渐开始进入到其他领域,例如经济学,政治学和市场营销。
从整个城市的乘车服务定位到预测性警报,都使用了模拟和预测。如今的云游戏技术能够实时运行大规模的模拟,让开放式世界游戏以及各种战略工具成为可能。
从1949年起,将游戏作为算法训练场就变得流行起来,数学家克劳德·香农(Claude Shannon)将国际象棋定义为探索思维概念的理想起点。香农在他的论文《为象棋编程中的计算机编程》中将象棋描述为一种游戏,其难度处于合理的范围内,而且这种游戏目标明确,需要特定的思维方式才能获胜。多年来,研究者一直在对计算机进行了各种不同的棋盘游戏训练。
1997年,IBM的Deep Blue击败了国际象棋冠军 Garry Kasparov,这一幕被写进了历史。多年后 Deep Mind 的 AlphaGo 战胜了围棋世界冠军 Lee Sedol 赢得了来自世界各地的关注。
近年来,人工智能研究成功的关键是奖励机制,算法通过给定的奖励,激励某一策略和路径的学习。
游戏和游戏引擎带来探索当然不止这些。下一篇我们将讲述更多游戏和游戏引擎为系统层面智慧带来的可能性。(编辑:春FANG)