ICCV2023论文速递(2023.9.4)!

共 1568字,需浏览 4分钟

 ·

2023-09-07 02:27


整理:AI算法与图像处理
CVPR2023论文和代码整理:https://github.com/DWCTOD/CVPR2023-Papers-with-Code-Demo
欢迎关注公众号 AI算法与图像处理,获取更多干货:


大家好,  最近正在优化每周分享的CVPR论文, 目前考虑按照不同类别去分类,方便不同方向的小伙伴挑选自己感兴趣的论文哈

最新成果demo展示:

标题:MagicAvatar:多模态虚拟人生成/驱动

标题:MagicAvatar: Multimodal Avatar Generation and Animation

论文:https://arxiv.org/abs/2308.14748

摘要:

本报告介绍了 MagicAvatar,一个用于多模式视频生成和驱动虚拟人的框架。与大多数直接从多模态输入(例如文本提示)生成以头像为中心的视频的现有方法不同,MagicAvatar 明确地将头像视频生成分为两个阶段:(1)多模态到运动和(2)运动到视频生成。第一阶段将多模态输入转换为运动/控制信号(例如人体姿势、深度、DensePose);而第二阶段则在这些运动信号的引导下生成以化身为中心的视频。此外,MagicAvatar 通过简单地提供目标人物的一些图像来支持头像动画。此功能使得能够根据第一阶段导出的特定运动来制作所提供的人类身份的动画。我们通过各种应用程序展示了 MagicAvatar 的灵活性,包括文本引导和视频引导的头像生成,以及多模式头像动画



Object-Centric Multiple Object Tracking

  • 论文/Paper: http://arxiv.org/pdf/2309.00233

  • 代码/Code: None

Human-Inspired Facial Sketch Synthesis with Dynamic Adaptation

  • 论文/Paper: http://arxiv.org/pdf/2309.00216

  • 代码/Code: https://github.com/aiart-hdu/hida

BuilDiff: 3D Building Shape Generation using Single-Image Conditional Point Cloud Diffusion Models

  • 论文/Paper: http://arxiv.org/pdf/2309.00158

  • 代码/Code: None

Self-supervised Semantic Segmentation: Consistency over Transformation

  • 论文/Paper: http://arxiv.org/pdf/2309.00143

  • 代码/Code: https://github.com/mindflow-institue/ssct

SoDaCam: Software-defined Cameras via Single-Photon Imaging

  • 论文/Paper: http://arxiv.org/pdf/2309.00066

  • 代码/Code: None

浏览 211
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报