ICCV2023论文速递(2023.9.4)!
最新成果demo展示:
标题:MagicAvatar:多模态虚拟人生成/驱动
标题:MagicAvatar: Multimodal Avatar Generation and Animation
论文:https://arxiv.org/abs/2308.14748
摘要:
本报告介绍了 MagicAvatar,一个用于多模式视频生成和驱动虚拟人的框架。与大多数直接从多模态输入(例如文本提示)生成以头像为中心的视频的现有方法不同,MagicAvatar 明确地将头像视频生成分为两个阶段:(1)多模态到运动和(2)运动到视频生成。第一阶段将多模态输入转换为运动/控制信号(例如人体姿势、深度、DensePose);而第二阶段则在这些运动信号的引导下生成以化身为中心的视频。此外,MagicAvatar 通过简单地提供目标人物的一些图像来支持头像动画。此功能使得能够根据第一阶段导出的特定运动来制作所提供的人类身份的动画。我们通过各种应用程序展示了 MagicAvatar 的灵活性,包括文本引导和视频引导的头像生成,以及多模式头像动画
Object-Centric Multiple Object Tracking
论文/Paper: http://arxiv.org/pdf/2309.00233
代码/Code: None
Human-Inspired Facial Sketch Synthesis with Dynamic Adaptation
论文/Paper: http://arxiv.org/pdf/2309.00216
代码/Code: https://github.com/aiart-hdu/hida
BuilDiff: 3D Building Shape Generation using Single-Image Conditional Point Cloud Diffusion Models
论文/Paper: http://arxiv.org/pdf/2309.00158
代码/Code: None
Self-supervised Semantic Segmentation: Consistency over Transformation
论文/Paper: http://arxiv.org/pdf/2309.00143
代码/Code: https://github.com/mindflow-institue/ssct
SoDaCam: Software-defined Cameras via Single-Photon Imaging
论文/Paper: http://arxiv.org/pdf/2309.00066
代码/Code: None