HyperPocket：生成点云网络-技术圈

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

小白导读

论文是学术研究的精华和未来发展的明灯。小白决心每天为大家带来经典或者最新论文的解读和分享，旨在帮助各位读者快速了解论文内容。个人能力有限，理解难免出现偏差，建议对文章内容感兴趣的读者，一定要下载原文，了解具体内容。

摘要

使用现代配准设备扫描真实场景通常会给出不完整的点云表示，这主要是由于扫描过程和3D遮挡的限制。因此，完成这样的部分表示仍然是许多计算机视觉应用的基本挑战。大多数现有的方法都是为了解决这个问题，通过学习在一个整洁的环境中重建单个3D对象的合成设置，这与现实生活中的场景相距甚远。在这项工作中，作者将点云的完成问题重新表述为物体幻觉任务。因此，作者引入了一种名为HyperPocket的基于自动编码器的新型架构，该架构可以解开潜在表示，从而能够生成已完成的3D点云的多个变体。作者将点云处理分成两个不相交的数据流，并利用超网络范式来填补缺失的对象部分留下的空间，即所谓的“口袋”。因此，生成的点云不仅是平滑的，而且是可信的和几何一致的场景。作者的方法提供了竞争性能的其他最先进的模型，并使大量的新应用。

论文创新点

作者的贡献总结如下:

作者将点云完成问题重新规划为物体幻觉任务，其灵感来自于人类如何将复杂的3D场景中被遮挡的物体分解成独立的物体，

作者介绍了一种基于超网络范式设计的自编码器的生成式超口袋架构，

作者的方法完成了一个真实的场景，对象遵循场景几何，同时适应现有环境的世代。

框架结构

作者的HyperPocket模型使用两个编码器为对象的现有部分和缺失部分生成单独的潜在表示。通过在代表缺失部分(架构的底部部分)的潜在空间上强制使用高斯分布，作者可以产生不同的点云补全。然后，这两种表示被连接并通过一个解码器，输出一个目标网络的权值用于产生一个完整的3D对象。

实验结果

HyperPocket模型在现实生活场景中的椅子重建。在第一栏中，作者呈现一个原始场景。在下一列中，作者可以看到各种可能的幻觉。

HyperPocket模型在场景中创建的椅子重建示例。第一列显示的场景与不完整的椅子(黑色)。第二列包含由HyperPocket模型创建的椅子的初始重建(蓝色)。接下来的三栏介绍了适应的过程。

结论

本文对点云补全问题提出了新的看法，并考虑了点云补全问题在物体幻觉任务中的生成扩展。作者的目标是产生完成一个给定点云的多种可能性，而不是提供一个单一的重建。为了解决这一问题，作者提出了一种基于超网络范式设计的自编码器的生成式超口袋结构。这样的解决方案可以在一个场景中产生许多不同的、不可见的物体的幻觉输出，就像人类在分解包含遮挡物体的复杂场景时直观地做的那样。作者表明，作者的方法提供了竞争性能的最先进的方法，并可以成功地应用到现实世界的场景。

论文链接：https://arxiv.org/pdf/2102.05973.pdf

每日坚持论文分享不易，如果喜欢我们的内容，希望可以推荐或者转发给周围的同学。

- END -

下载1：OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复：扩展模块中文教程，即可下载全网第一份OpenCV扩展模块教程中文版，涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2：Python视觉实战项目52讲

在「小白学视觉」公众号后台回复：Python视觉实战项目，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。

下载3：OpenCV实战项目20讲

在「小白学视觉」公众号后台回复：OpenCV实战项目20讲，即可下载含有20个基于OpenCV实现20个实战项目，实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~