问:在AI世界,推土机「生产」哪家强?
来源:学术头条
如果有人问你,「挖掘机技术哪家强?」
你大概率会想起这句知名广告词:「中国山东找蓝翔」。(不打广告,不打广告。)
那如果换个对象,换个问法,「在人工智能(AI)的世界里,哪一家的推土机更 cool?」
一个可能的答案是什么?
来,先斗一波图再说。
但事实上,它们在现实中的模板,只是下面这个普普通通的、「大黄蜂」颜色的推土机。
据介绍,他们可以利用人工智能技术将著名艺术品的风格融入任意 3D 场景中。
而且,相比于以往的研究,这一最新技术可以显示出更高质量的细节。
据论文描述,转换质量提高的原因是,研究团队的人工智能技术可以直接比较原始图像和新风格的 3D 场景之间的细节。而以往的人工智能技术,只是将图像特征转换为更紧凑的统计集进行分析,从而丢失了很多原始细节。
对此,论文作者之一 Kai Zhang 表示,「我们试图真正捕捉微妙的艺术风格,就像《星空》的笔触。这对人类的感知非常重要,因为我们的眼睛对局部细节非常敏感。」
在此次工作中,研究团队证明了基于最近邻特征匹配(NNFM)样式损失在捕捉风格细节方面非常有效,同时保持了多视图的一致性。
创造艺术形象通常需要大量的时间和特殊的专业知识,将艺术作品扩展到 2D 图像平面之外的维度,比如时间(在动画中)或 3D 空间(在雕塑或虚拟环境中),会面临很多限制和挑战。
研究团队表示,这一最新的风格转换技术(style transfer technique)未来有望用于动画电影和游戏行业中,用于手动微调前的风格模板。
此外,这一技术也同样适用于写实风格转换(photorealistic style transfers),比如将正午时的自由女神像转换为日落时的自由女神像。
而且,算法成功运算一次可能需要 20 分钟的时间。这是一个非常耗时的过程,因为在反复试验的过程中,人们可能会尝试不同的风格。
为此,研究团队在接下来的工作中将致力于提高内容生成的效率。
或许在未来的某一天,这一技术将用在人人都在使用的智能手机上。
参考资料:
https://arxiv.org/abs/2206.06360
https://www.cs.cornell.edu/projects/arf/
https://github.com/Kai-46/ARF-svox2
评论