用嘴做视频,这款应用太逆天
作者 | 冷思真
来源 | 爱范儿(ID:ifanr)
如需转载请联系原出处
“ 硅兔君荐语
AI界的“言出法随”新进展,同声传译有了,同声制作也来了~
今年,是 AI 在图像视频制作领域进步很大的一年。
有人拿着 AI 生成的图像拿走了数字艺术大奖,战胜了一众人类艺术家;有 Tiktok 这样的应用通过文字输入生成图片,变为短视频的绿幕背景;还有新的产品可以做到文字直接生成视频,直接实现「用嘴做视频」的效果。
这次的产品来自深耕人工智能多年,前段时间才因为元宇宙被疯狂嘲讽的 Meta。
▲ Meta 元宇宙曾被疯狂嘲讽 只是这次,你不能嘲讽它了,因为它真的有了小突破。
01 文字转视频,能做成什么样
现在,你可以动嘴做视频了。
这话虽然有点夸张,但 Meta 这次推出的 Make-A-Video 恐怕真是朝着这个目标前进的。 目前 Make-A-Video 可以做到的是:
- 文字直接生成视频——将你的想象力变成真实的、独一无二的视频
- 图片直接转为视频——让单一图片或两张图片自然地动起来
- 视频生成延伸视频——输入一个视频创建视频变体
02 文字转图片刚有进展,视频就来了 在《阿法狗之后,它再次彻底颠覆人类认知》中,我们曾经介绍过图像生成应用 DALL·E。曾有人用它制作出的图像去和人类艺术家 PK并最终取胜。 现在我们看到的 Make-A-Video 可以说是一个视频版本的 DALL·E(初级版)——它就像 18 个月前的 DALL·E,有巨大突破,但现在的效果不一定能让人满意。 ▲ DALL·E 创作的延伸画作 甚至可以说,它就是站在巨人 DALL·E 肩膀上做出成就的产品。相较于文字生成图片,Make-A-Video 并没有在后端进行太多全新变革。 研究人员在论文中也表示:「我们看到描述文本生成图片的模型在生成短视频方面也惊人地有效。」 ▲ 描述文本生成图片的获奖作品 目前 Make-A-Video 制作的视频有 3 个优点:
- 加速了 T2V 模型(文字转视频)的训练
- 不需要成对的文本转视频数据
- 转化的视频继承了原有图像/视频的风格
UpHonest Capital 威诚资本
成立于2015年,由硅谷知名投资人郭威创立 ,以全球化视角 ,专注投资硅谷和中国的早期优质初创企业。成立至今,机构累计投资超过400家初创企业,30个独角兽项目。UpHonest Capital立足跨境创新,通过运营旗下拥有10w+影响力的科技自媒体、国际化孵化加速平台、覆盖硅谷科技人才的智库与活跃的创业者社群等多元业态,深耕早期孵化投资,构建了独特且完善的早期跨境投资生态,赋能未来创变者。
别忘了点关注,不迷路啊。
👇👇👇
创业即巅峰,她的抑郁症自我救赎之路,是冲进两千亿市场