解锁Midjourney隐藏技能:改改Prompt,四宫格就「裂变」了

机器学习与生成对抗网络

共 2650字,需浏览 6分钟

 ·

2023-08-26 23:36

本文来源  机器之心  编辑:张倩

我们离真正的「AI 电影」不远了?


Midjourney 是很多人都在使用的一款文生图工具。结合最近更新的视频生成工具 Runway Gen2,你甚至可以自己制作一个电影预告片,最近社交媒体上很火的《Trailer: Genesis》(《创世纪》)、《流浪地球 3》电影预告片都是借助这些 AI 工具生成的。

不过,这些「预告片」都有一些局限,比如时长短、画面缺乏变化。要想克服这些局限,如何更好地利用以上工具成了摆在所有制作者面前的难题。
最近,一位名为「Chase Lean」的推特博主在 Midjourney 的使用上「发现了新大陆」。他表示,只要在 Prompt 里使用一些技巧,你就能让 Midjourney 生成数张角色高度一致的图像(Midjourney 默认生成 4 张角色相对随机的图像),而且角色的拍摄角度、所处环境可以是非常多样的。如果用到上述电影预告片的制作中,这相当于为制作者提供了更多样的素材,以此为基础生成的视频将更具故事性。
457a90ba613af23344d37365593eae4a.webp
Chase Lean 是怎么做的呢?以一次性生成 6 张同一人物图为例,他的做法是在 Prompt 中加入「split into 6 different images, shot from multiple angles」。不过,这个方法并非 Chase Lean 首创。他表示,自己的灵感来自一位名叫「juliewdesign_ 」的推特博主,这位博主发现了「image split into 2」在 Prompt 中的妙用(生成两张角色一致的图像)。
8eaaa231b9d8b530c9fa5f53df017a61.webp
Chase Lean 延续了这一做法,并在此基础上进行了扩展。比如,你可以按「V4」按钮让生成的若干张图像更富于变化(V1、V2、V3、V4 对应了生成的四张图片,点击其中一个按钮,系统会推送四张对应图片的细节调整版)。
cadfef4e91f01ce632d4fa1b88712347.webp
以下是变化的结果:
f83e66cf8aa7a9b7b8e059fa1b3d10cc.webp
更有意思的是,如果结合 Midjourney 6 月份推出的「Zoom Out」功能,你甚至能得到更多图像(按 Zoom Out 按钮可以像调整焦距一样把更大的画面包含到镜头中,完成特写到远景的切换,Midjourney 5.2 版本提供了三种缩放选择,分别是 1.5 倍、2 倍以及「1.0 到 2.0」之间的自定义缩放):
f03cf8b58e7808496891c03146b804dc.webp
不断重复以上的「变化」、「缩放」等操作,理论上你可以得到无限多的同一角色的图像。
如果想改变图像背景(环境),你可以先选出想修改的图像(按 U1-U4 按钮),然后按「Custom Zoom」按钮,这个按钮允许用户同时缩放画面和修改 Prompt。此时,在 Prompt 中加入沙滩、城市等自定义环境的词,你就可以获得同一角色场景多样的图像。
2219bc94daaad1491ecdc6c1d222919c.webp
从生成的图中可以看到,某些图其实尺寸非常小,而且环境画面是不完整的。要解决这个问题,Chase Lean 建议使用 Clipdrop 网站上的「Uncrop」功能。
6b90a31f1a70ab68255a4c5ebe108438.webp
Chase Lean 表示,这种一次生成多张图像且保持角色一致的方法在现实中有很多用途,他已经在时尚、家庭、动漫等多种场景中进行了尝试。
ea5de5678168ba37514422fb50270367.webp
有个比较有趣的场景是为孩子制作漫画书。比如,以「a boy surfing at the beach, blue waves, palm trees, 3d, unreal engine; split into 4 different images, shot from multiple angles —niji —style expressive」为 Prompt,Chase Lean 一次就生成了以下 8 张图。
fbc90fa3c66f9330ac9226473764cddd.webp
按下「Zoom Out 2x」按钮,他得到了更多图像:
22d6e8c0fc068a2cba1967a09a21e729.webp
如此简单的方法却如此有效,Chase Lean 的分享给了很多人启发。
29b0ab5a3525730bbd668c5ed9ed82e2.webp

有人已经按照步骤,「复现」了 Chase Lean 在推特上展示的效果。
46f3f6d753db353fb30b80896831417e.webp
按照这样的进展速度,我们离看上真正的「AI 电影」可能已经不远了。
参考链接:https://twitter.com/chaseleantj/status/1693246015124713634

关注公众号【机器学习与AI生成创作】,更多精彩等你来读

卧剿,6万字!30个方向130篇!CVPR 2023 最全 AIGC 论文!一口气读完

深入浅出stable diffusion:AI作画技术背后的潜在扩散模型论文解读

深入浅出ControlNet,一种可控生成的AIGC绘画生成算法! 

经典GAN不得不读:StyleGAN

f3aa4bde2fa9f92b77ee1da2aea7ba24.webp  戳我,查看GAN的系列专辑~! 一杯奶茶,成为AIGC+CV视觉的前沿弄潮儿!
最新最全100篇汇总!生成扩散模型Diffusion Models ECCV2022 | 生成对抗网络GAN部分论文汇总
CVPR 2022 | 25+方向、最新50篇GAN论文
 ICCV 2021 | 35个主题GAN论文汇总
超110篇!CVPR 2021最全GAN论文梳理
超100篇!CVPR 2020最全GAN论文梳理

拆解组新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》


《礼记·学记》有云:独学而无友,则孤陋而寡闻

点击 一杯奶茶,成为AIGC+CV视觉的前沿弄潮儿! ,加入  AI生成创作与计算机视觉  知识星球!

浏览 18
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报