重磅直播!OmniDrive: 基于稀疏查询的三维自驾VLM框架

3D视觉工坊

共 741字,需浏览 2分钟

 ·

2024-07-11 07:00

点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达

本次分享我们邀请到了北京理工大学 王仕豪,为大家详细介绍他们的工作:OmniDrive。如果您有相关工作需要分享,欢迎文末联系我们。

OmniDrive: A Holistic LLM-Agent Framework for Autonomous Driving with 3D Perception,Reasoning and Planning

论文:http://arxiv.org/pdf/2405.01533
代码:https://github.com/NVlabs/OmniDrive
详情:NVIDIA最新开源!OmniDrive:结合大模型推进自动驾驶3D感知、推理、规划

直播信息

时间

2024年7月11日(周四)19:00

主题

OmniDrive: 基于稀疏查询的三维自驾VLM框架

直播平台

3D视觉工坊哔哩哔哩


嘉宾介绍

王仕豪

2024年硕士毕业于北京理工大学。主要研究方向为自动驾驶BEV目标检测,端到端自动驾驶和多模态视觉语言模型等。

直播大纲

  1. 基于稀疏查询的3D自动驾驶系统

  2. 自动驾驶3D多模态数据集

  3. 自动驾驶3D多模态模型

参与方式

本次分享我们邀请到了北京理工大学 王仕豪,为大家详细介绍他们的工作:OmniDrive。如果您有相关工作需要分享,欢迎联系:dddvisiona。

浏览 2
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报