重磅直播!OmniDrive: 基于稀疏查询的三维自驾VLM框架
3D视觉工坊
共 741字,需浏览 2分钟
·
2024-07-11 07:00
点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达
本次分享我们邀请到了北京理工大学 王仕豪,为大家详细介绍他们的工作:OmniDrive。如果您有相关工作需要分享,欢迎文末联系我们。
OmniDrive: A Holistic LLM-Agent Framework for Autonomous Driving with 3D Perception,Reasoning and Planning
论文:http://arxiv.org/pdf/2405.01533
代码:https://github.com/NVlabs/OmniDrive
详情:NVIDIA最新开源!OmniDrive:结合大模型推进自动驾驶3D感知、推理、规划
直播信息
时间
2024年7月11日(周四)19:00
主题
OmniDrive: 基于稀疏查询的三维自驾VLM框架
直播平台
3D视觉工坊哔哩哔哩
嘉宾介绍
王仕豪
2024年硕士毕业于北京理工大学。主要研究方向为自动驾驶BEV目标检测,端到端自动驾驶和多模态视觉语言模型等。
直播大纲
基于稀疏查询的3D自动驾驶系统
自动驾驶3D多模态数据集
自动驾驶3D多模态模型
参与方式
注:本次分享我们邀请到了北京理工大学 王仕豪,为大家详细介绍他们的工作:OmniDrive。如果您有相关工作需要分享,欢迎联系:dddvisiona。
评论