生成式AI，引领AI从“换脸”到“造脸”-技术圈

未标题-1副本.png

《中智观察》第1531篇推送

记者：木易

编辑：豆芽

头图来源：界面新闻

日前，Gartner发布了2022年重要战略技术趋势。其中，生成式人工智能（Generative Artificial Intelligence）位列12项重要战略之首。

同时Gartner预计，到2025年，生成式人工智能将占所有生成数据的10%，而目前这一比例还不到1%。

也能看到，在2020年Gartner发布人工智能技术成熟度曲线报告2020时（Hype Cycle for Artificial Intelligence，2020），生成式人工智能便作为新增技术热点首次被提出。

今年的（Hype Cycle for Artificial Intelligence，2021）报告中，生成式人工智能同样位列其中。

以上种种迹象表明，Gartner对生成式AI是多么看重。那么，生成式AI究竟是什么？生成式AI又能给智能时代带来什么？

训练后的再创造

先来看一张图。您觉得下图中这个金发碧眼、带着婴儿肥的小男孩是真实存在的吗？

AI合成小男孩

ZHONGZHIGUANCHA

答案是No。这是由人工智能合成的。

再看一张图。您觉得下图中这位女士像是人工智能合成的吗？

AI合成的女士

ZHONGZHIGUANCHA

答案是Yes。

上述这两张图均来自“ThisPersonDoesNotExist.com”网站。

也不止这两个，“ThisPersonDoesNotExist.com”网站中，每次刷新出来的人物，都是现实中根本不存在的。

如果不知道真相，是否你根本无法判断出真假？

这便是生成式AI的一种应用。

对于生成式AI，Gartner这样定义：通过各种机器学习（ML）方法从数据中学习工件的组件（要素），进而生成全新的、完全原创的、真实的工件（一个产品或物品或任务），这些工件与训练数据保持相似，而不是复制。

简单理解。生成式AI是利用现有文本、音频文件或图像创建新内容的技术。使用生成 AI，计算机检测与输入相关的基本模式并生成类似内容。

GANs,生成式AI的核心技术

在此必须看下生成式对抗网络（GANs, Generative Adversarial Networks ），这是生成式AI的关键技术。其本质是一种深度学习模型，是近年来复杂分布上无监督学习最具前景的方法之一。

2014年，研究人员首次使用计算机，利用生成对抗网络GANs，创造出了逼真的人脸。

在原理上，生成式对抗网络使用两个神经网络相互对立，一个生成器和一个判别器。生成器或生成网络是一个神经网络，负责生成类似于源数据的新数据或内容。判别器或判别网络是负责区分源数据和生成数据之间的神经网络。

这两个神经网络都经过交替周期训练，生成器不断学习生成更逼真的数据，判别器则更善于区分假数据和真实数据。

可以把GANs想象成一个造假者，一个在猫捉老鼠游戏中的警察，造假者正在学习传递假币，而警察正在学习检测假币。渐渐地，双方在对抗中都不断完善。

AI生“万物”

当下，生成式AI已在研究和商业的多种场景得到应用，如创建软件代码、促进药物研发和有针对性的营销等。具体而言：

生成图形：AI可以从艺术品中抽象视觉图案，然后将这些图案应用到具有该艺术品特征的虚拟图像再现中。这些算法还可以将任何粗糙的涂鸦转换为令人印象深刻的绘图，该图像似乎是由描绘真实世界的专业人类艺术家创作的。

生成式AI可以手绘人脸草图，并以算法将其转换为逼真图像，也可以指示计算机呈现任何图像，以便看起来好像是由特定的人类艺术家以特定的风格创作的。

生成照片：生成式AI可以通过生成并叠加到原始任何缺失、模糊或误导性的视觉元素上来自动更正照片，还可以将任何低分辨率原始图像转换为高分辨率版本，也可以通过混合现有的肖像或从任何特定的肖像中抽象特征来产生自然的外观，或者从语义标签中生成逼真的图像。

生成音频：生成式AI可以将任何计算机生成的声音渲染成一个真正听起来像是在人类声带中自然产生的声音，也可以将文本翻译成语音、可以组成音乐。

同样，生成式AI也可以生成视频、文本、字幕等。

生成材料：生成式AI甚至可以通过3D打印、CRISPR和其他技术从零开始呈现假肢、有机分子和其他物品。

这也意味着，该技术也会被滥用于诈骗、欺诈、造谣、伪造身份等违法场景。

率先发力的迪斯尼、Netflix、影谱科技

那么，如今哪些公司在发力生成式AI呢。通过其能生成音视频、字幕等很容易联想到，传媒娱乐公司一定在使用。

的确，包括迪士尼、Netflix等娱乐传媒巨头均在尝试用生成式AI代替标准内容制作。例如迪士尼借助生成式AI生成动画，只需通过文本描述某些活动，而不是注释数据和大量训练就能创建动画、电影剧本视频。

Netflix会借助生成式AI抽取符合观影习惯和需求的画面，然后把这些图片制作成内容封面，以降低内容搜寻难度，提升视频制作效率。

去年9月上市的Unity是3D生成型AI的推动者。全球有超过一半的移动、PC 和主机游戏采用了其生成引擎来制作，其3D-AI技术也广泛应用于工业设计的3D模型搭建，VR/AR设备内容创作以及影视特效制作。

一家名为Insilico Medicine（英科智能）的AI药物研发公司也是生成式AI的应用者。该公司于2014年1月在美国成立（2019年将总部迁到香港），是一家抗衰老及癌症治疗药物研发商，依托基因组学、医疗大数据及AI技术等技术手段，专注于癌症治疗、抗衰老药物的研发、生产及销售，同时面向用户提供健康管理、癌症预防等服务。

2015年，Insilico Medicine在全球范围内率先利用生成对抗网络(GANs)和强化学习(RL)技术，生成具有特定性质的药物分子结构。

同时，Insilico Medicine也是全球第一家应用GANs，以生成具有特定参数的新分子结构在 Oncotarget 及 Molecular Pharmaceutics上发表开创性论文的公司，该公司也在研究癌症、帕金森病、老年性痴呆、渐冻人、糖尿病、肌肉减少症和衰老等新药开发计划。

不止国外。国内的影谱科技在2018年底便发布AGC智能影像生产引擎，这也是国内最早一批借助生成式AI开发的技术框架。

影谱科技的智能影像生成引擎MAGC已率先应用在传媒娱乐领域，被知名电视台、电信运营商、短视频平台广泛采纳。除此之外，MAGC还广泛应用于数字人的3D成像，影视特效制作及数字孪生、虚拟主播、虚拟课堂等数字产权场景。

智能影像生成模拟

ZHONGZHIGUANCHA

面向文娱领域，影谱科技打造的智能文娱解决方案可以帮助产业推动视频自动化生产，提高内容生产效率，在视频帧审校、视频过滤、内容推荐到视频审核、视频深度预测、流媒体视频及短视频内容生产、故事可视化等产业环节应用。

面向传媒领域，影谱科技推出的智慧传媒平台服务，从内容创建到分发，形成以元数据为基本单位的一站式智能影像技术服务，提供包括批量化创建智能影像、视频资产管理与分析、智能影像运营、再到智能视频商业化的全过程。

基于影谱科技智能影像技术的AI方案，可在处理新闻、体育赛事等内容发挥作用。例如，实时自动绘制虚拟越位线，包括徽标，识别名人，提取字幕、人物图像等。

洞见2022·第五届中国企业服务年会

洞见2022 · 中国企业服务年会

11月18日北京香格里拉酒店

商务合作：13811819315