多模态图像版「GPT-3」来了!OpenAI推出DALL-E模型,一句话即可生成对应图像
新智元
共 3353字,需浏览 7分钟
· 2021-01-09
新智元报道
新智元报道
来源:OpenAI
编辑:Q、小匀
【新智元导读】OpenAI又放大招了!今天,其博客宣布,推出了两个结合计算机视觉和NLP结合的多模态模型:DALL-E和CLIP,它们可以通过文本,直接生成对应图像,堪称图像版「GPT-3」。
![](https://filescdn.proginn.com/01985b4068ee57a5699586366b69b602/5d1372f867bd540e4dc99ca21b25d5f2.webp)
![](https://filescdn.proginn.com/943196546e8304aaf7747efd9040d8f4/a36d110eb8636a09e8341f39dd3a0279.webp)
![](https://filescdn.proginn.com/0e3b0f8918f12b4542961e448760fce1/6ccd2d2999619421f0c2aa8ec4a025ca.webp)
![](https://filescdn.proginn.com/c442a1b4b1f6c75a0cf1004401a2d320/6919f55d572f96796a9a944e1fa596b3.webp)
![](https://filescdn.proginn.com/44142b3d59ea01fe6d19b7c37d223603/b229c624885ead4dcbd93abfcdf7235f.webp)
![](https://filescdn.proginn.com/da977fb38a99b37842fa0c409d6796a7/ef73cc66d93ad7e3f11696e9c5c1a747.webp)
![](https://filescdn.proginn.com/86cdac02ae16d92ce673810d06269fe6/38c006f42926f421a984e4e844cd5083.webp)
![](https://filescdn.proginn.com/5c1f2452c6cfa024a64286f7aeb15c32/b0fd18650ba598170a8df7217498c262.webp)
![](https://filescdn.proginn.com/0ebecc89769a0d3f3e89dd3272a36ecf/99e095f1592353d78a3797148b190b71.webp)
![](https://filescdn.proginn.com/1019e4a551ebae92d9a22fea4cbf806f/44195bf24478d065772c80da4e7bf7af.webp)
![](https://filescdn.proginn.com/3cec4e57e89448bc7fdd3a08cc1f0956/9b31f8aea4e0a1805997266e1b59d4cd.webp)
DALL-E和CLIP等类似的一系列生成模型,都具有模拟或扭曲现实来预测人们如何绘制风景和静物艺术的能力。比如StyleGAN,就表现出了种族偏见的倾向。
而从事CLIP和DALL-E的OpenAI研究人员呼吁对这两个系统的潜在社会影响进行更多的研究。GPT-3显示出显著的黑人偏见,因此同样的缺点也可存在于DALL-E中。在CLIP论文中包含的偏见测试发现,该模型最有可能将20岁以下的人错误地归类为罪犯或非人类,被归类为男性的人相比女性更有可能被贴上罪犯的标签,这表明数据集中包含的一些标签数据存在严重的性别差异。
参考链接:
https://openai.com/blog/dall-e/
![](https://filescdn.proginn.com/2324f8af8c72757a3dbe61b7999b2e87/a0f605d40ae9bed5939e1982015cfdf9.webp)
评论
语言模型将了解视觉世界?OpenAI 120亿参数图像版GPT-3发布
↑ 点击蓝字 关注极市平台作者丨贾伟 梦佳来源丨智源社区编辑丨极市平台极市导读 OpenAI的联合创始人IIya Sutskever 曾在吴恩达编辑的 《The Batch周刊 - 2020年终特刊》上撰文称“2021年,语言模型将开始了解视觉世界...
极市平台
0
GMPI多平面图像生成框架
GMPI(GenerativeMultiplaneImages)是一个多平面图像生成框架,使2DGAN具有3D感知能力。生成的输出称为“生成多平面图像”(GMPI),并强调其渲染不仅质量高,而且保证视
GMPI多平面图像生成框架
0