马斯克直播FSD V12自动驾驶：45 分钟内仅一次人工干预，顺手去了趟小扎家！-技术圈

整理 | 郑丽媛、出品 | CSDN（ID：CSDNnews）

这些年来马斯克画过的“饼”，大大小小的不在少数，如今终于实现了一个。

网友：“Elon，先别管跟小扎格斗的事了，你啥时候在能在 X 上直播测试 FSD Beta V12 啊？”

马斯克：“下周。”

于是乎，上周末马斯克如期在 X（原推特），首次直播演示了备受期待的全自动驾驶系统 FSD V12：没有任何剪辑，直播时长为 45 分钟，共吸引了 1000+ 万人观看。

   这里顺手推荐下我们自研的Youtube视频语音转换插件（https://youtube-dubbing.com/），一键外语转中文配音，英语不好又想紧追前沿技术的小伙伴可以试试，感觉不错的话帮忙转发下，也欢迎提意见，下面是演示视频：

  

45 分钟直播，只有一次人工干预

在这次直播中，马斯克驾驶的是基于 HW3 硬件的 Model S 车型，之所以没有使用 HW4 硬件，是因为目前 HW4 尚不支持 FSD V12。

马斯克解释称，由于 FSD V12 采用端到端的架构，即输入视觉等传感器信号，输出转向、刹车、加减速等车辆控制信号，跟现有版本有巨大差距，与 HW4 的数据不完全兼容，因此仍需针对 HW 4 硬件进行重新优化。

这趟长达 45 分钟的试驾由 FSD V12 全程接手，起点是位于帕洛阿尔托的特斯拉总部——整个过程中，除了手动输入目的地之外，马斯克只进行了一次人工干预。

首先，马斯克随机选择了斯坦福大学作为目的地：“让我们看看它是如何做到的，出发吧！”

开始还没多久，这辆特斯拉就顺利经过了一个施工路段。

在路口要变道转弯时，特斯拉也准确移动到了正确的车道。

甚至，它还懂得在减速带前提前减速，尽可能保证乘客体验良好。马斯克表示：“从直播中可能很难看出，但实际上汽车行驶得非常平稳。”

到达第一个目的地后，或许想到了与小扎之间还没实现的格斗之约，马斯克选择的第二个地点，是小扎的家。

再次启程的 Model S，没多久就遇到了非常复杂的环形交叉路口：它静静等着前面的车辆先走，然后再慢慢地转弯。

到达新目的地后，马斯克并没有真的冲去小扎家里，而是又随机选择了一个地点。而这辆 Model S 在到达地方后，自行选择了一个合适的地方停在路边。

整个 45 分钟直播过程中，在 FSD V12 系统驾驶下的特斯拉行驶得十分顺利，马斯克几乎只充当了一个“输入目的地”的工具人。

不过还是有一处失误，让马斯克旁边跟着试驾的同事亲自上手干预：在直播约 20 分时，Model S 本该等着直行的绿灯，但当对面信号灯转为左转状态时，Model S 突然也跟着启动了。

对此，马斯克笑着调侃道：“好的，现在你知道为什么它（FSD V12 ）还没有向公众发布了。”

FSD V12 完全“基于视频培训”

在这场直播中，马斯克反复强调了一点：特斯拉工程师们，没有在 FSD V12 系统中写过任何一行有关车辆行路规则的代码。

不论是“遇到减速带要减速”，还是“要给骑自行车的人让路”，亦或是“环形交叉路口要等其他车辆驶过”等等，马斯克一直表示：我们没有对此进行编程，没写过任何一行有关的代码，FSD V12 的所有表现完全“基于视频培训”。

“看这减速带，汽车需要放慢速度……它做到了。我们没有编程，没有一行代码说减速带要减速，它（FSD V12）完全是基于视频培训来做到这一点的。”

“刚刚还遇到了一个骑自行车的人，也没有任何一行代码规定要给骑自行车的人让路。”

“同样，也没有任何一条代码规定要在停车标志前停车或等待其他车辆，也没有要等待 X 秒之类的规定。”

“我们从未针对环形交叉路口的概念进行编程，只是向它展示了一堆关于环形交叉路口的视频。”

也就正如马斯克之前所说的：“新的 FSD V12 版本，是端到端的输出！”

最新的 FSD V12 系统，不再依赖传统的高精地图和导航数据，抛弃了传统的 “if else” 规则驱动的触发方式，而是通过车载摄像头和神经网络，使用 AI 算法来识别道路和交通情况。

马斯克介绍道，FSD V12 主要通过 AI 对 8 个 HW3 摄像头的视频进行实时判断，从而对车辆进行控制，以此实现端到端的自动驾驶。这 8 个摄像头以每秒输入 36 帧的最大速度运行（实际运行速度应该高达每秒 50 帧，只不过摄像机只能达到每秒 36 帧），通过纯 AI 计算更快地处理这些图像。

减少了 30 万行代码，功率仅需 100W

令人惊叹的是，据马斯克透露，这样一套 FSD V12 系统的功耗只有 100W：“在特斯拉设计的 AI 计算机上，以 36FPS 的速度运行 8 个摄像头所需的推理计算功率，仅约为 100W——这微不足道的功率，足以实现超人驾驶！”

除此之外，FSD V12 通过将 AI 与机器视觉相结合，就不再需要传统的预训练了，也无需再对每个道路元素或情况进行单独编码，只要给大模型喂饱了相关视频数据，它就会自己慢慢理解并做出决策。

所以，FSD V12 的代码量也减少了超过 30 万行：“在第 11 版的显式控制栈中有 30 多万行 C++ 代码，第 12 版中基本上没有。”但没有代码并不意味着不可控，在马斯克看来，只要有数据就能控制想要的东西。

在直播中，马斯克提到为了帮助 FSD V12 做出正确的决策，特斯拉内部非常重视喂给大模型的数据质量：“大量平庸的数据并不能改善驾驶水平。我们要确保所有输入的数据都是优质正面的驾驶数据，而这就是为什么数据管理非常困难的原因。”

同时，由于对 FSD V12 输入大量视频数据后，它会自主分辨最佳行驶操作，因此 FSD V12 的推理都在本地进行，即它不需要连接互联网连接也能正常工作，在不熟悉的地形上也能应对自如。

尽管 FSD V12 的直播表现可圈可点，但当前 V12 仍处于测试版，马斯克也表示特斯拉目前在全球各地都有 FSD V12 测试人员，包括新西兰、挪威、泰国或日本等。

等到未来 FSD V12 足够安全流畅后，不知马斯克是否会兑现他之前画过的另一张“饼”，将其免费试用：

“一旦 FSD 体验足够丝滑（不仅是安全）后，我们计划在北美给所有车主开放一个月免费试用。在确保全球其他地区功能正常并且法规允许后，我们也会推动 FSD 的用户免费试用。”

那么，你对于 FSD V12 的看法如何，对其又是否看好呢？

参考链接：

https://twitter.com/elonmusk/status/1695247110030119054

https://twitter.com/treb5475/status/1695289700620341311

   ------

  

我们创建了一个高质量的技术交流群，与优秀的人在一起，自己也会优秀起来，赶紧点击加群，享受一起成长的快乐。另外，如果你最近想跳槽的话，年前我花了2周时间收集了一波大厂面经，节后准备跳槽的可以点击这里领取！

马斯克直播FSD V12自动驾驶：45 分钟内仅一次人工干预，顺手去了趟小扎家！

推荐阅读