给几个关键词就能出摄影大片,英伟达GauGAN上新2.0:将文本转成逼真图像
来源:迈微AI研习社 本文约1700字,建议阅读5分钟
GauGAN2 有超1亿参数,训练数据达1000万张图像。
在 2019 年举办的 GTC 大会上,英伟达展示了一款新的交互应用GauGAN:利用生成对抗网络(GAN)将分割图转换为栩栩如生的图像。
时隔 2 年,英伟达官方推出了 GauGAN 的继任者 GauGAN2,允许用户创建不存在的逼真风景图像。GauGAN2 将分割映射、修复和文本到图像生成等技术结合在一个工具中,旨在输入文字和简单的绘图就能创建逼真的图像。
英伟达表示:「与类似的图像生成模型相比,GauGAN2 的神经网络能够产生更多种类和更高质量的图像。」用户无需绘制想象场景的每个元素,只需输入一个简短的短语即可快速生成图像的关键特征和主题。
例如输入「海浪打在岩石上」,模型会根据生成的内容逐渐进行相应的调整,以生成与描述匹配的逼真图像。
目前 GauGAN2 还在研发阶段,但英伟达已为用户提供了一个 demo 地址,可在线试玩。
简单输入几个关键词就能生成想要的风景图,看起来非常有趣。
GauGAN2 的生成模式
GauGAN2 现在有几种模式,可以从不同的输入生成逼真的图像。
模式 1:输入简笔画。







参考链接:
https://blogs.nvidia.com/blog/2021/11/22/gaugan2-ai-art-demo/
评论