逼真到颤抖!Midjourney画出完美中国情侣,画师、演员、模特一键淘汰

新智元

共 3376字,需浏览 7分钟

 ·

2023-03-20 18:01

1441fb7cf8c395c472d3b7e9e29dac62.webp


   新智元报道  

编辑:编辑部
【新智元导读】继GPT-4之后,Midjourney V5上线。网友纷纷试玩,画出了一对中国情侣,视觉炸裂,碾压人类画师。

昨天,由Midjourney V5画的一对中国情侣在网上引起轩然大波。 许多人纷纷惊呼:人类画师别活了。 dac34970c42855055fdb33f8dce91a94.webp有人不相信这是Midjourney之作,也亲手体验了一把。在输入以下的promot后,画风瞬间惊艳了。 「A pair of young Chinese lovers, wearing jackets and jeans, sitting on the roof, the background is Beijing in the 1990s, and the opposite building can be seen --v 5 --s 250 --q 2」 67417ae0dff803f7208f462d00c092bd.webp在GPT-4发布后,Midjourney也更新了V5,不仅绘图更逼真,而且prompt更灵敏。 最重要的是,一直被诟病的「AI 不会画手指」,Midjourney V5都拿捏了。 65b9f8201722c2bb2ab21357f2986a65.webp还有满屏的电影质感,除了OMG,还是OMG。 121c4943969cf5934dc1a4c624bb483d.webp甚至有网友惊呼:模特不存在了! c240bf6502a3e127e291f73ae49d4a45.webp

效果炸裂,一大波设计师要失业了

从Midjourney的V1到V5,就可以看到AIGC这一年来的进化速度有多快。 最新V5版的图像质量更高、输出更多样化、有更广泛的风格、支持无缝纹理、有更宽的纵横比、有更好的图像提示,以及更宽的动态范围…… 激动的心,颤抖的手,国内网友纷纷上手实操了一波。 先上手的写真图: 2d49b65bbd2c3cb83ccddff2c1c36715.webp7424450218bdf2490f194e1ac20c8004.webp虽然V5能够画出5根手指,但是在手指的细节上,还是差点意思。 c8d7917a50c58b81c7f72a143244d1f8.webp比如试着让Midjourney V5给梵高的房间拍个照: 8320b95a5f2481f6bc4598e4efd88ae8.webp2934d6f0c71a7dd8391dad1aa039f66c.webpMidjourney V5在画中国美女的神态时,把控也是非常到位。 e69be6413a61616a257616447689c919.webpV5还能拿捏中国古典风格的美,画出了亭亭玉立的美人,细节颗粒度拉满。 f4138c10add4db6ee730baf53747e091.webp还有网友用GPT-4+Midjourney V5创作了电影「杭州重生」,连豆瓣上介绍页都P出来了,看起来还真是那么回事儿。 b45e18ef66eb65acc0b2f9abcdd90c2c.webp在2022年12月,谭木匠举办了一场梳子比赛,人类设计师设计的梳子如下: 4d7f7138e019becd8cc42a1fa51b58a2.webp网友黄仲生用V5试了一波,并惊讶地发现「麻瓜」在AI面前完全不能打。 16c5f17f9ca071651daba99752675794.webpee451c2508ca9d60aa2dec73b77f5c0e.webp当别人反馈说上面的梳子太美,只能用来收藏,网友又整了一波日常可用的梳子。 5c4af47712bbb15368f2b38215502a41.webp还有给小朋友用的梳子 15942f530303cd96eaeb87bc12bb4b8e.webp在国外,有网友直接用Midjourney V5画出了The Matrix的电影质感,让人瞬间怀疑这是不是电影里的截图。 并且献上了prompt: 「Keanu Reeves in The Matrix. AI cinema. Synthography. Cinematic. Film grain. --ar 16:9 --v 5」 e87ceb06efe42697c8a9cbb6979f3674.webpaa08c2dde03c7f81ddef32a8bbf70684.webp还有网友尝试用「民宅火灾现场微笑女孩」经典meme让Midjourney创作「城堡火灾现场微笑洛基」。3eb6408ca1b78c13917ce0833ffcd81b.webp 来看下这炸裂的效果。 8fc7a7c8be625beedc6862d99102936f.webp 87de62c8c04a8d421f5d35385dc71f35.webp网友还开脑洞把「北京屋顶情侣」图加上洛基元素。 13465e455884d9ee46b41d7dcc636464.webp 还有个搞笑版的,龙卷风来了,老太太骑着电驴在「狂飙」。 851d803beed948f0dc4b2f15687a349c.webp亚洲人的脸部特征也是做的非常逼真。 fa35912775f571c43ea9bf14c797db70.webpaa48fdaeca1faa1db6ed43442f153796.webp312264b09ba8b7685ca214ce463fa367.webp旅行博主都不用出门,直接在家调教Midjourney就可以了。 4c200ed3d95ba35de08c438eeb539dd8.webp还有网友拿V4和V5做了对比图,通过输入一张图,还有文字提示,V4生成的图片在光照下物体阴影处理方面无法与V5相比。 45bd0267f11762f8de417fb8b428aa51.webp再来一张眼睛特写图: ca0dd2f8e38af5bb0329079b26991687.webp通过对V3、V4、V5这三个版本输入相同提示、相同设置,对其输出图片进行了对比。 在V5这个版本中,波光粼粼的水面,还有鱼儿在水中游的倒影,已经达到了以假乱真的程度。 3d468a74f7a41c2065ff5381b6105aa9.webpeacad5e77e458b5a41a3614e5e16a809.webp但是如果没有提供有关环境的文本的提示,比起V4,V5默认生成了更加真的环境。 d777be2326d3584057f3e09abf699499.webp网友迫不及待地让V5来复刻一下王家卫「蓝莓之夜」的电影风格,发现V5在处理玻璃的反射方面做得更逼真了。 1f412d60a00965b7a114726fe8a6c9d1.webp以及各种真假难辨的作品: cf4586c2332a8078fc4bacf38fe4c359.webp反派气质拉满的马斯克: a9337df8af77ef6e5e53d0cd5eb19bad.webp「猫戴VR」: 7e2d1e986567194f6765f6a7f86faa8f.webp

比V4强在哪?

最新升级的V5,相较于前一版有什么改进,一位研究员就他们之间的对比做了一张表: 49e1adcfd0aa0797a4e0d34eb66d2ba9.webp 1. 密铺(--tile argument) 在创建模式时使用。此前V3有这一参数,然而在V4中暂时终止使用,V5版本重新上线。 比如输入「/imagine tesseract pattern, repeat, white and blue highlights --s 1000 --v 5 --tile」,生成如下的图: bc7f28520aae9899c949442aeb22a771.webp 2. 长宽比(--ar argument ) 在V4中,只能有不高于1:2或不宽于2:1的自定义纵横比。而在V5中,你可以自定义比率与任何「宽度: 长度」比,如下是自定义比例的演示: d75f5d3ace6cdd59437dac528f03909b.webp这一点升级,意味着什么? 现代电影中常见的最宽纵横比2.39:1都能够实现,你可以制作电影巨幕,人人都能成为导演!

bc697794e1c15366782679676c7df9d5.webp

V5生成2.4:1电影画幕 3. 图像权重可以自定义( -- iw argument) 图像提示中的权重现在可以输入自定义值。你可以决定输入图像对最终生成的图像的影响程度。 如下,在Midjourney V5中,输入一张图和一句文本提示。 9f7034bcab6d5fb4505e6a5d455033d0.webp通过自定义不同权重,2、1、0.5生成了不同的图片。 输入的提示如下:「/imagine http://imgur.com/romman.png a roman soldier with daisies in the background --seed 123 --iw 2 --v 5」

48eff370997b0a66f5eab1fd93d6d726.webp

4. less opinionated

「less opinionated」意味着,在V4中,只需要编写较少的文本提示,Midjourney便会输出更具创造性的图像。 但V5不是这样的,你可能需要输入更多的形容词,并给出更多的细节,比如风格或情绪,输出图像应该是什么样子。如果没有更多描述,Midjourney就会输出一个默认风格,比如「摄影」风格。 这一点升级,可以让人们通过文本提示能够更精准地把控Midjourney输出的内容。也意味着,在输入文本和输出图像之间有「更多的内聚力」。 以上4点升级是官方博客中提到,但是最让人意想不到的是Midjourney V5能够画出「5个手指和脚趾」! fc414eb310524f47c9d7956a59a9759e.webp27c710eb9226500a83c85e930d201d48.webp另外,V5已经在更真实的图像/照片上进行了微调,因此可以看到在输出窗户反射和透过玻璃的图片上更加真实。 906a8c0365c6c1072a3da3b250a161ab.webpc4b10e7303ca06b6987f257642e76efb.webp

考考眼力见

最后来一个测试题: 下面4张图,只有一张是真人,其他都是Midjourney V5画的,猜猜真人是哪一张? ace74f21e541db6c0ce1130ec16a1175.webp590d87888a6da98af274279332fa7daa.webp1f18e8c72c068d9f6e22c5fa47bdd2b8.webpa286a77087ac04a276f9d0e5e04a6dd7.webpd913446c132c49826548e59d79297dd6.webp
参考资料: https://bootcamp.uxdesign.cc/midjourney-v5-is-here-so-whats-new-df3f3a645295 https://twitter.com/mranti/status/1637326003927396352?s=46&t=iBppoR0Tk6jtBDcof0HHgg


fb7d8847b1f979de04c6dd8b022b3673.webp
8a44bf8e2115ac105d637e1c648b2793.webp
1e7ac1629bb1a1aa9dadb1bcf63ef299.webp
浏览 41
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报