情人节「告白生成器」来了！这个AI能让偶像对你说情话，过于真实！-技术圈

点击上方“CVer”，选择加"星标"置顶

重磅干货，第一时间送达

情人节将至，当其他人还在苦思冥想如何准备情人节礼物时，我却已经收到了我最喜欢的idol说给我的情话视频～不仅如此，我还用自己的照片说出了亲爱的ta最喜欢的告白台词，究竟是什么技术让我能够在这个情人节脱颖而出？

什么？说我吹牛。那先来放一些我的idol情话视频的节选！

哼哼，这下总算是相信了吧？多亏了这项绝技，只要我手里拥有「人脸图片/视频」和「告白音频」，不仅可以拥有idol对我说情话的视频，甚至是用我本人的脸，也可以同样说出优美的情话、唱出动人的情歌，“美丽的皮囊+有趣的灵魂”——这样完美的搭配，简直是完胜其他人的情人节礼物，再假装不经意地发在朋友圈中，简直是标准“凡尔赛式秀恩爱”呀~

什么？你以为这门绝技需要耗时耗力？

大错特错！PaddleGAN（飞桨生成对抗网络套件）中的Wav2lip唇形精准合成算法让你轻松变身「情场高手」！

心急的小伙伴直接传送门去查看完整开源的项目呀：

https://github.com/PaddlePaddle/PaddleGAN

开源不易，欢迎Star支持啊！

接下来，就让我们来简单了解下这个技术原理，和具体的操作步骤，手把手教你如何让新垣结衣告白，让小罗伯特唐尼说周星驰电影经典桥段“我养你”或者让任何你心仪的Idol说情话꒰ᐢ⸝⸝•༝•⸝⸝ᐢ꒱

而这个「让idol说情话、自己唱情歌」的魔法总共只需要四步！！！

① 安装Paddle环境并下载PaddleGAN

② 选择想要「被告白/对口型」的idol/人脸以及「告白台词音频」内容

③ 将准备好的「人脸视频/图片」以及「告白台词音频」输入Wav2lip模型中，让这个模型进行推理工作

④ 输出idol的嘴唇与告白语音做出匹配唇形动作的idol说情话视频，就可以分享到朋友圈过凡尔赛式的情人节啦~

聪明的小伙伴们可能注意到了，这里面最核心的就是名称为Wav2lip的模型，那它到底是个什么原理呢？

PaddleGAN的唇形迁移能力

Wav2lip

Wav2lip是PaddleGAN中提供的一个基于GAN的唇形动作迁移算法模型，它的网络结构可以通过VisualDL直接查看到：

Power by VisualDL：

https://github.com/PaddlePaddle/VisualDL

Wav2lip模型实现唇形与语音精准同步突破的关键在于：

采用唇形同步判别器（Discriminator），以强制生成器（Generator）持续产生准确且逼真的唇部运动。
通过在判别器中，使用多个连续帧而不是单个帧，并使用视觉质量损失（visual quality loss），而不仅仅是对比损失（L1 Loss）来考虑每帧之间的时间相关性，从而很大程度的提升视觉效果。

详情请见：

https://github.com/PaddlePaddle/PaddleGAN/blob/develop/docs/en_US/tutorials/wav2lip.md

而且！！！万能的Wav2lip模型适用于任何人脸、任何语音、任何语言！对任意语音及视频都能达到很好的融合，达到逼真的效果！

还在担心不会使用？

PaddleGAN团队为大家在AI Studio上准备了对应的公开项目，里面包含了完整的实现步骤及代码，AI Studio的免费算力助力大家体验「告白」视频的制作，让你轻轻松松获得「芳心」！

贴心的传送门：

https://aistudio.baidu.com/aistudio/projectdetail/1542850

项目的具体详细介绍如下：

1.下载PaddleGAN并安装所需依赖

# 进入工作目录
%cd /home/aistudio/work
# 从github上克隆PaddleGAN代码（如下载速度过慢，可用gitee源）
!git clone https://gitee.com/PaddlePaddle/PaddleGAN
#或者使用 !git clone https://github.com/PaddlePaddle/PaddleGAN
# 安装所需安装包
!mkdir sndfile
%cd sndfile
!wget http://www.mega-nerd.com/libsndfile/files/libsndfile-1.0.28.tar.gz
!tar xzvf libsndfile-1.0.28.tar.gz
%cd libsndfile-1.0.28
!./configure --prefix=/home/aistudio/build_libs CFLAGS=-fPIC --enable-shared 
!make
!make install
%cd /home/aistudio/work/PaddleGAN
!pip install -r requirements.txt
%cd applications/

2.执行唇形合成命令

!export PYTHONPATH=$PYTHONPATH:/home/aistudio/work/PaddleGAN && python tools/wav2lip.py --face /home/aistudio/work/jieyi13s.mp4 --audio /home/aistudio/work/gaobai12s.m4a --outfile pp_gaobai_jieyi.mp4

具体的参数使用说明如下：