聊聊旷厂黑科技 | 室内视觉定位导航,补齐导航的最后一块拼图
点击左上方蓝字关注我们
转载自 | 旷视研究院
“路线规划成功,开始导航”,“前方十字路口请沿最右侧道路行驶”......这些导航语音已经成为了很多人依赖的信息播报。面对每天层出不穷的城市新坐标,手机地图导航拯救了迷茫的路痴,成为了车主、行人的“导航眼”。
但是,距离完全拯救路痴,还有“最后一块拼图”要加速补齐。在停车场寻找商场出入口、电梯间;在大型商场里找到咖啡馆、餐厅;甚至在办公楼里,找会议室...这些复杂的室内场景催生了对“室内导航”的需求,但受限于空间和信号的限制,室内导航的技术发展还没有完全成熟。
以AI 算法见长的旷视也一直在寻求和探索低成本、全离线、简单易用的室内视觉定位方式。
2019年的10月,在旷视内部的一次Hackathon 大赛中,旷视的算法研究员受到自家机器人产品上的视觉重定位技术启发,想出了在手机上使用摄像头进行视觉定位寻找会议室的创意。经过近两年的持续打磨和升级,目前该技术已在现实中得到落地,有望加速视觉定位系统行业应用。
在7月举办的旷视技术开放日上,研究员也向参观者实地演示了室内视觉定位导航系统:打开指定手机 App,只需用摄像头对准周围特征明显的环境,选取要前往的目的地,App 就可以直接获取当前位置的定位信息,和前往目的地的路径导航,在 AR 实景叠加的路线、路标、箭头指引下,帮助用户轻松找到目的地。
00:15
01
室内导航技术仍需提升
室内定位与导航的作用,是在室内场景下利用手机或其他移动设备,实现定位并引导用户抵达目的地。相较臻于成熟的室外定位系统,室内定位由于对精度要求更高、施工部署更难、定位平台不统一等原因,发展相对滞后。
具体来说,由于室内环境复杂多变,房间、物品之间的距离更近,参与定位的设备又多,室内导航对定位精度的要求远高于室外,尤其是部分涉及到高速移动设备定位的行业,对精度的要求可能是厘米级,同时对定位时延要求也非常苛刻。此外,形成室外定位网络需要发射卫星,对接的管理部门线条清晰,但室内定位网络需要在每个楼宇单独部署站点,需要大量的物业协调沟通,同时室内空间私密性更强,进一步增加了布网的工作量。碎片化的应用场景也增加了更新维护室内地图的成本。
来源:中国移动牵头发布的《室内定位白皮书(2020年)》
目前,市面常见的室内导航,主要依靠蓝牙、WiFi 等技术进行识别,这也不可避免地容易产生成本较高、精度较低、场景使用受限等问题。尤其在举办大型演唱会或球赛等相对封闭的场馆,即使有移动或者 WiFi 信号,但现场万人扎堆,手机信号差,几乎不可能完成导航。随着应用场景多样化、复杂化,以及用户体验需求不断提升,现阶段的室内导航亟需新的技术加以升级改善。
02
室内视觉定位技术的优势
相较于其他室内定位技术,室内视觉定位技术具有高精度、易部署的特点,无需对室内建筑环境二次装修改造,仅使用激光视觉地图采集设备对现有环境采集,就可以实现定位功能,并且将传统GPS定位的5米精度,WiFi、蓝牙定位的1-3米精度提升至亚米级精度。
以旷视研发的室内视觉定位导航系统为例,它无需借助过多设备,除手机外无需额外增加传感器,室内环境也无需加装辅助定位设备,因而具有成本优势。同时,根据不同场景的需求,系统支持手机离线使用,无需依赖网络信号,即可完成定位+导航。对于商场、停车场、医院、体育场馆等有着寻找目的地需求的场景,室内视觉定位导航可以极低的初装及维护成本灵活接入。
03
室内视觉定位技术三部曲
室内视觉定位导航系统,主要由激光视觉联合建图、纯视觉定位和 AR 导航三个核心技术所支撑。旷视凭借在图像识别和 SLAM 技术(即时定位与地图重建)等方面的传统优势,早在几年前就已经开始研发建图和视觉定位算法,并将领先的算法应用到了产品中。旷视2020年上市的S800V AGV,就已经使用这套算法。而在今年CVPR 2021 Image Matching比赛上,旷视更是凭借相应算法勇夺两项冠军。
建图
和成语“按图索骥”一样,作为实现室内导航的第一步,建图至关重要。在建图阶段,旷视使用自研建图背包设备采集数据,再使用激光与视觉联合的建图技术进行建图,保障了视觉特征点的精度达到厘米级。
激光视觉联合视觉特征点建图
定位
视觉SLAM作为一项日趋成熟的技术,已经逐渐应用在AGV、自动驾驶等行业。在手机上做视觉SLAM,则是旷视将积累的传统优势算法用在新业务、新场景的尝试。相比于如使用AGV的工厂场景等,室内定位的场景更加复杂多变,会更多地出现如白墙长走廊、室内结构重复等不利于传统视觉SLAM的情况。对此,旷视一方面积极提升定位算法效果, 如CVPR 2021夺冠算法就可以在更多场景完成匹配定位;另一方面在视觉SLAM精确定位前,基于旷视领先的图像识别技术加入了更多的辅助定位策略,可以在先将用户位置确定在一个比较小的范围后再视觉定位,解决了重复场景定位失败的问题。
AR
AR (Augmented Reality,即增强现实技术)是一种创新的交互方式,可实时地计算摄影机影像位置和角度,并加上相对应图像、视频、3D 模型的技术,最终目标是在屏幕上把虚拟世界置放到现实世界中,进行交互。旷视基于手机 AR 技术,结合路径规划算法与 VIO 技术实现室内的实时 AR 导航,进一步增强了导航系统的操作易用性。相比于传统的二维地图导航,也提升了用户体验和交互。
在室外定位导航日趋完善的今天,室内精细定位导航终将补齐导航服务的“最后一块拼图”。从2019年的小试牛刀,到如今落地应用在国家大型场馆等,旷视室内导航技术如同一粒种子,一直拔节生长到今天,持续打磨和升级,为当下应用,也为未来前瞻。
END
整理不易,点赞三连↓