马斯克直播FSD V12自动驾驶:45 分钟内仅一次人工干预,顺手去了趟小扎家!

公众号程序猿DD

共 4077字,需浏览 9分钟

 · 2023-08-31

整理 | 郑丽媛、出品 | CSDN(ID:CSDNnews)
这些年来马斯克画过的“饼”,大大小小的不在少数,如今终于实现了一个。
网友:“Elon,先别管跟小扎格斗的事了,你啥时候在能在 X 上直播测试 FSD Beta V12 啊?”
马斯克:“下周。”
于是乎,上周末马斯克如期在 X(原推特),首次直播演示了备受期待的全自动驾驶系统 FSD V12:没有任何剪辑,直播时长为 45 分钟,共吸引了 1000+ 万人观看。
这里顺手推荐下我们自研的Youtube视频语音转换插件(https://youtube-dubbing.com/),一键外语转中文配音,英语不好又想紧追前沿技术的小伙伴可以试试,感觉不错的话帮忙转发下,也欢迎提意见,下面是演示视频:


45 分钟直播,只有一次人工干预
在这次直播中,马斯克驾驶的是基于 HW3 硬件的 Model S 车型,之所以没有使用 HW4 硬件,是因为目前 HW4 尚不支持 FSD V12。
马斯克解释称,由于 FSD V12 采用端到端的架构,即输入视觉等传感器信号,输出转向、刹车、加减速等车辆控制信号,跟现有版本有巨大差距,与 HW4 的数据不完全兼容,因此仍需针对 HW 4 硬件进行重新优化。
这趟长达 45 分钟的试驾由 FSD V12 全程接手,起点是位于帕洛阿尔托的特斯拉总部——整个过程中,除了手动输入目的地之外,马斯克只进行了一次人工干预。
首先,马斯克随机选择了斯坦福大学作为目的地:“让我们看看它是如何做到的,出发吧!”
开始还没多久,这辆特斯拉就顺利经过了一个施工路段。
在路口要变道转弯时,特斯拉也准确移动到了正确的车道。
甚至,它还懂得在减速带前提前减速,尽可能保证乘客体验良好。马斯克表示:“从直播中可能很难看出,但实际上汽车行驶得非常平稳。”
到达第一个目的地后,或许想到了与小扎之间还没实现的格斗之约,马斯克选择的第二个地点,是小扎的家。
再次启程的 Model S,没多久就遇到了非常复杂的环形交叉路口:它静静等着前面的车辆先走,然后再慢慢地转弯。
到达新目的地后,马斯克并没有真的冲去小扎家里,而是又随机选择了一个地点。而这辆 Model S 在到达地方后,自行选择了一个合适的地方停在路边。
整个 45 分钟直播过程中,在 FSD V12 系统驾驶下的特斯拉行驶得十分顺利,马斯克几乎只充当了一个“输入目的地”的工具人。
不过还是有一处失误,让马斯克旁边跟着试驾的同事亲自上手干预:在直播约 20 分时,Model S 本该等着直行的绿灯,但当对面信号灯转为左转状态时,Model S 突然也跟着启动了。
对此,马斯克笑着调侃道:“好的,现在你知道为什么它(FSD V12 )还没有向公众发布了。”
FSD V12 完全“基于视频培训”
在这场直播中,马斯克反复强调了一点:特斯拉工程师们,没有在 FSD V12 系统中写过任何一行有关车辆行路规则的代码。
不论是“遇到减速带要减速”,还是“要给骑自行车的人让路”,亦或是“环形交叉路口要等其他车辆驶过”等等,马斯克一直表示:我们没有对此进行编程,没写过任何一行有关的代码,FSD V12 的所有表现完全“基于视频培训”。
  • “看这减速带,汽车需要放慢速度……它做到了。我们没有编程,没有一行代码说减速带要减速,它(FSD V12)完全是基于视频培训来做到这一点的。”
  • “刚刚还遇到了一个骑自行车的人,也没有任何一行代码规定要给骑自行车的人让路。”
  • “同样,也没有任何一条代码规定要在停车标志前停车或等待其他车辆,也没有要等待 X 秒之类的规定。”
  • “我们从未针对环形交叉路口的概念进行编程,只是向它展示了一堆关于环形交叉路口的视频。”
也就正如马斯克之前所说的:“新的 FSD V12 版本,是端到端的输出!”
最新的 FSD V12 系统,不再依赖传统的高精地图和导航数据,抛弃了传统的 “if else” 规则驱动的触发方式,而是通过车载摄像头和神经网络,使用 AI 算法来识别道路和交通情况。
马斯克介绍道,FSD V12 主要通过 AI 对 8 个 HW3 摄像头的视频进行实时判断,从而对车辆进行控制,以此实现端到端的自动驾驶。这 8 个摄像头以每秒输入 36 帧的最大速度运行(实际运行速度应该高达每秒 50 帧,只不过摄像机只能达到每秒 36 帧),通过纯 AI 计算更快地处理这些图像。
减少了 30 万行代码,功率仅需 100W
令人惊叹的是,据马斯克透露,这样一套 FSD V12 系统的功耗只有 100W:“在特斯拉设计的 AI 计算机上,以 36FPS 的速度运行 8 个摄像头所需的推理计算功率,仅约为 100W——这微不足道的功率,足以实现超人驾驶!”
除此之外,FSD V12 通过将 AI 与机器视觉相结合,就不再需要传统的预训练了,也无需再对每个道路元素或情况进行单独编码,只要给大模型喂饱了相关视频数据,它就会自己慢慢理解并做出决策。
所以,FSD V12 的代码量也减少了超过 30 万行:“在第 11 版的显式控制栈中有 30 多万行 C++ 代码,第 12 版中基本上没有。”没有代码并不意味着不可控,在马斯克看来,只要有数据就能控制想要的东西。
在直播中,马斯克提到为了帮助 FSD V12 做出正确的决策,特斯拉内部非常重视喂给大模型的数据质量:“大量平庸的数据并不能改善驾驶水平。我们要确保所有输入的数据都是优质正面的驾驶数据,而这就是为什么数据管理非常困难的原因。”
同时,由于对 FSD V12 入大量频数据后,它会自主分辨最佳行驶操作,因此 FSD V12 的推理都在本地进行,即它不需要连接互联网连接也能正常工作,在不熟悉的地形上也能应对自如。
尽管 FSD V12 的直播表现可圈可点,但当前 V12 仍处于测试版,马斯克也表示特斯拉目前在全球各地都有 FSD V12 测试人员,包括新西兰、挪威、泰国或日本等
等到未来 FSD V12 足够安全流畅后,不知马斯克是否会兑现他之前画过的另一张“饼”,将其免费试用:
“一旦 FSD 体验足够丝滑(不仅是安全)后,我们计划在北美给所有车主开放一个月免费试用。在确保全球其他地区功能正常并且法规允许后,我们也会推动 FSD 的用户免费试用。”
那么,你对于 FSD V12 的看法如何,对其又是否看好呢?
参考链接:
https://twitter.com/elonmusk/status/1695247110030119054
https://twitter.com/treb5475/status/1695289700620341311

------
我们创建了一个高质量的技术交流群,与优秀的人在一起,自己也会优秀起来,赶紧点击加群,享受一起成长的快乐。另外,如果你最近想跳槽的话,年前我花了2周时间收集了一波大厂面经,节后准备跳槽的可以点击这里领取

推荐阅读

··································

你好,我是程序猿DD,10年开发老司机、阿里云MVP、腾讯云TVP、出过书创过业、国企4年互联网6年从普通开发到架构师、再到合伙人。一路过来,给我最深的感受就是一定要不断学习并关注前沿。只要你能坚持下来,多思考、少抱怨、勤动手,就很容易实现弯道超车!所以,不要问我现在干什么是否来得及。如果你看好一个事情,一定是坚持了才能看到希望,而不是看到希望才去坚持。相信我,只要坚持下来,你一定比现在更好!如果你还没什么方向,可以先关注我,这里会经常分享一些前沿资讯,帮你积累弯道超车的资本。

浏览 2923
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报