编辑:小咸鱼
【新智元导读】麻省理工学院媒体实验室(MIT Media Lab)的研究人员开源了一个虚拟角色生成工具。该工具结合了面部、手势、语音和动作领域的人工智能模型,可用于创建各种音频和视频输出,一举登上《Nature Machine Intelligence》。
这年头,用人工智能创建一个数字虚拟人感觉越来越容易了。不过,关于数字人,不少言论都集中在「它有误导性」和「它背后的deepfake技术有潜在的隐私泄露风险」这两个观点上。其实,这项技术也可以用于积极的目的,比如,让阿尔伯特·爱因斯坦复活,去教一堂物理课,或者与年长的自己聊一聊天。为了鼓励这项技术所能带来的积极作用,麻省理工学院媒体实验室(MIT Media Lab)的研究人员开源了一个易于使用的虚拟角色生成管道。该虚拟角色生成管道结合了面部、手势、语音和动作领域的人工智能模型,可用于创建各种音频和视频输出。使用人工智能技术制作的蒙娜丽莎、玛丽·雪莱、马丁·路德·金、阿尔伯特·爱因斯坦、文森特·梵高和威廉·莎士比亚的动画该虚拟角色生成管道还使用了可追踪的、人类可读的水印标记了其输出的结果。这样一来,它生成的内容就可以与真实的视频内容区分开来,进而防止一些恶意的用途。研究人员希望教师、学生和医疗保健工作者可以尝试一下,看看这个工具能否在各自的领域帮助到他们。研究人员在《Nature Machine Intelligence》上写道,如果有更多的学生、教育工作者、卫生保健工作者和治疗师有机会构建和使用这些虚拟角色,那么,这些虚拟角色可能会为更多人带来福祉。论文地址:https://www.nature.com/articles/s42256-021-00417-9斯坦福虚拟人类互动实验室的创始主任杰里米·巴伦森(Jeremy Bailenson)表示:「当人工智能和人类开始共享身份时,这将是一个奇妙的世界。这篇论文完成了令人难以置信的工作,描绘了在教育、健康、亲密关系等领域,AI生成角色的可能用途,同时给出了一个切实可行的路线图,说明了如何避免隐私泄露和虚假视频。」
该论文的第一作者Pat Pataranutaporn是Pattie Maes流体界面研究小组的博士生。他说,「尽管世界上大多数人都是从deepfakes那里了解虚拟人技术的,但我们认为它有潜力成为创造性表达的工具。」
生成性对抗网络(GAN),是两个相互竞争的神经网络的组合,使得创建极具真实感的图像、克隆声音和生成人脸动画变得更加容易。Pataranutaporn与Danry一起,在一个名为Machinoia的项目中首次探索了生成人脸动画的可能性。统一管道允许用户提供视频、语音或文本作为输入,以生成视频和实时面部滤镜在这个项目中,Pataranutaporn创造了各个年龄段的自己:少年、青年、中年、老年,让他们从不同的角度和自己进行对话。Pataranutaporn说:「这次不寻常的经历让我意识到自己作为一个人的旅程。这是一次非常新奇的体验——用你自己的数据来揭示你自己以前从未想过的东西。」研究人员说,自我探索只是AI虚拟角色的积极应用之一。实验表明,虚拟人可以使学生对学习更有热情,并提高认知任务的表现,并作为传统教学的补充。Pataranutaporn解释说,这项技术为教学提供了一种「根据兴趣和个人背景进行个性化定制,并且可以随着时间的推移而改变」的方式。Machinoia技术还可以用于在视频会议中隐藏自己的脸,但是还能保留面部表情和情绪。如果人们要在会议上共享个人敏感信息(如健康和创伤经历),那这项技术会很有用。在今年秋天,由Maes和研究机构Roy Shilkrot共同教授的Deepfakes实验课上,学生们用这项技术将一幅描绘清明历史场景的中国画中的人物制作成了动画。有的同学还用Deepfakes创建了一个「分手模拟器」。
研究人员在论文中指出,随着技术的发展,虚拟人技术的蓬勃兴起也带来了不少法律和伦理问题。例如,如何决定谁有权以虚拟数字化的形式重现一个历史人物?名人的AI克隆人在网上推广有害行为,谁承担法律责任?与人类相比,人们更喜欢与虚拟人互动,这有什么危险吗?「我们这项研究的目标之一是提出问题,并就如何使用这项技术来造福社会展开公开讨论」,Maes说。「通过分享AI虚拟人这项技术,同时明确标注由它生成的视频是合成的」,Pataranutaporn说,「就可以激发更多有创造性和积极的用例,这样才能让人们了解到这项技术的潜在好处」。
参考资料:
https://news.mit.edu/2021/ai-generated-characters-for-good-1216
https://www.nature.com/articles/s42256-021-00417-9