3D重建:硬派几何求解vs深度学习打天下?

3D视觉工坊

共 1698字,需浏览 4分钟

 ·

2021-06-08 20:45

研究人员都希望能够赋予机器和人类感官一样的感知,其中就包含视觉。作为人类最重要的感官之一,人类接受到的信息中超过 70% 来源于双眼。然而,这对计算机来说却是一个难点——3D 世界中形状不同的物体可以在 2 维世界中拥有一模一样的投影,3D 形状的估计实际上是一个非适定性问题(ill-posed problem)。传统研究主要利用各类几何关系或者先验信息,而近年来随着深度学习的流行,对几何方法的研究似有所忽视。
加州大学伯克利分校马毅教授也曾表示,没有把几何关系条件严格用到位的算法,都是不科学的,根本谈不上可靠和准确。
当前3D视觉技术的不断发展及相关产业需求的提升,基于图像的三维重建技术受到越来越多的关注。CVPR 2021目前已公布了所有接收论文ID,接收率为23.7%,其中以“3D”为名的文章超过了 90 篇,占比达收录论文的8%左右。
3D视觉技术应用范围也非常广泛,例如AIOT中的室内3D环境的重建,自动驾驶的矢量高精地图的重建以及AR产业中虚拟人等。
(图片来源于网络)
学术界研究火热,产业应用落地广泛。面对三维重建的广阔发展前景,很多伙伴想要入门该领域。
但基于图像的三位重建融合了计算机视觉、数字图像处理和计算机图形学等多门学科的知识,是一套非常复杂的工程系统,涉及知识点多且杂,初学者不仅要具备深厚的数学功底,同时也需要熟练的C\C++编程能力,相较于其他视觉领域,三维重建的入门门槛要高很多。
在这种环境下,市面上又很难找到系统学习的资料,这让大家一度陷入困境。
如何摆脱这种困境呢?
基于此,深蓝学院开设了『基于图像的三维重建』在线课程。通过本门课程的学习,大家能够快速建立完整的知识架构体系,理解整个系统的原理和技术流程,大家在透彻理解传统的图像建模方法的同时,能够一起探讨结合深度学习的前沿发展技术!
针对代码实践,团队对三维重建开源系统MVE进行了较大程度的重构,以适应课程章节。整套系统的代码,仅仅调用了libpng、libjpeg、libtiff、eigen等库,逐行手写核心算法函数的全部代码,便于大家理解核心操作的原理。

讲师简介
隋唐
高级算法工程师
原中科院自动化所助理研究员
中科院自动化所模式识别与智能系统博士
博士期间的主要研究方向为三维计算机视觉与计算机图形学,研究课题为基于图像的三维建筑模型重建,在顶级国际期刊 IEEE TVCG 等主流期刊会议以第一作者发表多篇文章。同时,基于博士期间的研究成果,研发若干三维重建相关系统并申请专利。

课程大纲

(点击查看大图)

课程收获
1. 掌握运动恢复结构(Structure From Motion)的算法框架和基本原理;
2. 掌握主流的稠密点云重建的算法框架和基本原理;
3. 掌握表面重建、纹理图像自动生成和编辑的技术原理;
4. 具备利用图像建模的基本技术和原理完成室内重建、图像拼接、纹理贴图、3D可视化渲染等实际项目的能力。

还能收获
 1. 优质的学习圈子
伙伴们大多是来自985、211及海外院校硕博,在这里大家一起学习、进行讨论与研究。独一无二的优质圈子将是你未来学习与就业的宝贵资源。
往期已报名学员学校&公司部分展示

2. 企业认可的证书

参与课程培训的同学,颁发深蓝学员毕业证书,综合表现排名10%的同学,颁发优秀学员证书,为你的简历加分添彩


课程服务
1. 三师助力
讲师&助教及时答疑解惑,班主任全程带班督学,同学们传帮带的锦囊社群
(社群内,大家积极讨论技术细节)
2. 定期班会
助教1V1批改作业,并在班会中进行讲评和指导;在班会中,学习更多技巧;在交流中收获更多思路。

抢占优惠名额

现在报名,即可优惠50
备注“ 682  ”,优先咨询哦~

添加『新月』老师
领取三维重建论文
浏览 21
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报