姿态可控的Talking Face Generation隐式模块化 Audio-Visual 表征 (CVPR 2021)

AI算法与图像处理

共 357字，需浏览 1分钟

·

2021-04-29 14:25

https://github.com/Hangz-nju-cuhk/Talking-Face_PC-AVS

https://arxiv.org/abs/2104.11116

摘要：

提出了一种姿态可控的视听系统（PC-AVS），该系统实现了任意语音人脸的自由姿态控制。我们没有从音频中学习姿势运动，而是利用另一个姿势源视频来仅补偿头部运动。关键是设计一个不含口型和身份信息的隐式低维姿态编码。通过这种方式，视听表示被模块化为三个关键因素的空间：语音内容、头部姿势和身份信息。

浏览 147

点赞

收藏

分享

举报

评论

图片

表情

CVPR 2021 | “以音动人”：姿态可控的语音驱动说话人脸

机器学习与生成对抗网络

CVPR 2021 | 任何人都能“不讲武德”，姿态可控的语音驱动说话人脸

程序员大白

基于GAN的说话人驱动：talking face generation解读

机器学习与生成对抗网络

CVPR 2021 Area Chair：谈CVPR 2021审稿

组监督学习: 通过可控的解耦表征学习模拟人脑想象力！ ICLR 2021

告别Heatmap！人体姿态估计表征新方法SimDR

CVPR 2021 Short-video Face Parsing Challenge 季军方案分享

【论文解读】CVPR 2021 当之无愧的最佳论文奖：GIRAFFE，一种可控图像合成方法

机器学习初学者

CVPR 2021 竞赛汇总

CVPR 2021专题1：GAN的改进

机器学习与生成对抗网络

点赞

收藏

分享

举报