马斯克机器人炫技引千万网友围观!

数据分析1480

共 2402字,需浏览 5分钟

 ·

2024-04-10 18:12

梦晨 克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

特斯拉机器人,开始干家务了。

马斯克通过最新视频,晒起特斯拉擎天柱机器人叠衣服,引发大量网友围观。

1f6f93d7a3e7cf39b70421fbd0f3691b.webp

现在机器人叠衣服只需要3步,30秒一件

第一步,先把衣服从篮子里拿出来,直接就叠好一边袖子。

bca97ef5f8e8b64d1900ed71d9a3e49e.webp

第二步,丝滑调整衣服位置,对齐另外半边。

80cebd7f83122f4fbf29f714125e0abd.webp

最后一头一尾连续对折一气呵成。

f15dc5aa74f5fc833da189697e43961f.webp

已经有人迫不及待询问什么时候可以买到了。

6c2736b9fa7f0870069c3ecf620ce504.webp

也有网友提出,快给孩子买个谢耳朵同款叠衣板吧。

0d1bd6bda6c2899bfd473bebfe63ef15.webp

热评第一则开始思考未来的人们会如何看待这一时刻。

efc7139ae0e379a650a104fa8ac4a72f.webp

鉴于之前火爆全网的斯坦福机器人做饭视频引起了大量误会,马斯克稍后也补充了一个免责声明

重要提示:擎天柱目前尚不能自主执行叠衣服操作,但将来肯定能够在任意环境(桌子不需要完全固定,篮子里也不需要只有一件衣服)中完全自主执行。

0ffeed3232218db0eb16beb2a9e87d5b.webp

只说了不能完全自主,演示具体如何实现的马斯克没细说,但仔细看视频里其实露出了马脚。

从第8秒开始,右下角有一只机械手悄悄出现,动作轨迹与机器人完全一致,稍有一点延迟。

17b39840360df7d66af5953fecdde565.webp

那么答案也很明显了,与斯坦福的方法一样,AI都是从模仿人类动作开始练起

caef656f796b3a41d1e25bb5ae629de3.webp

但正如AI预测蛋白质、AI画图等技术的发展过程,AI从能干一件事到超越人类也用不了多久。

硅谷资深科技博主Robert Dcoble认为少于17个月,你觉得呢?

3b1dea982cf8963dd354f60a9c5b4098.webp

特斯拉二代机器人

这个会叠衣服的机器人,已经是特斯拉Optimus的二代目了,加上之前的原型机Bubmlebee,一共经历了两次大升级。

bfa45260127b4afc3cbcfe296a56fafe.webp

其中最值得关注的,是特斯拉为Optimus全新打造的手部。

与前一代相比,新款机器人的手不仅动作更快,自由度也增加到了11个,还新增了触觉传感器。

284b6e26e6aac4ddd737f8d38a8198fa.webp

而且也懂得控制力度,从盒中捏起鸡蛋,倒手,再放进碗里,整个过程没有出现把鸡蛋捏碎的情况。

24e72768e459f9d490f82441b71ed4e4.webp

除了手部以外,Optimus的颈部也进行了全新改版,采用铰接式结构,拥有两个自由度。

1bc44ea174a94ce12a4c660283291d7f.webp

同样在Optimus的脚上也采用了铰接结构,并模仿了人类脚部的几何形状。

而从整体上看,Optimus的移动速度比前一代增加了30%,重量减轻了10公斤。

d41a79c0c81dec0943f3179741a0514a.webp

升级后的机器人,可以轻松完成深蹲的动作,整个过程都能很好地保持平衡。

02a8581ca8617411b5174d832578a9a0.webp

不仅是特斯拉,进入2024年,人类在机器人上取得的新进展就如雨后春笋般出现。

2024,家用机器人元年?

2024才刚刚过去半个月,包括特斯拉在内就已有至少4项机器人领域的突破性成果。

这些机器人的一个共性特征,是先通过模仿人类来学习,然后逐渐脱离人类操作实现自主行动。

比如斯坦福的ALOHA机器人,通过人类的遥操作可以完成烹饪等一系列复杂的动作,而人类的操作过程恰好也是机器人学习的素材。

eedb3aa2bbb150a798398f060e6f0dbb.webp

经过学习之后,机器人可以自主掌握一些人类动作,从而完成特定的任务。

f54133b5e292078ac495a7cfbcafc370.webp

几乎是在同一时间,谷歌DeepMind也发布了自己的机器人模型Robotics Transformer(简称RT)的升级版。

而且是三个框架联发——RT-Trajectory解决泛化能力问题,SARA-RT用于提升决策速度,AutoRT则负责数据收集。

其中用于提升泛化能力的RT-Trajectory,主要是借助多模态大模型的视觉能力实现,学习素材同样从人类的动作捕获或直接人工绘制的轨迹。

3a18fe83a8a88e8ff0bf809ac22f8068.webp

紧随斯坦福和DeepMind之后,机器人初创公司Figure也推出了自己的“咖啡机器人”Figure 01

不需要任何的遥操作,它就可以自主完成打开机器盖、放入咖啡、启动机器的全过程,还能自主纠错。

训练时,Figure 01同样是学习人类动作,只不过学习的方式是视频。

只用了10个小时的端到端训练,Figure 01就熟练地掌握了用机器制作咖啡的过程。

883da76e9e46d4daa951b7566ee4d9b0.webp

除了近期的几项成果,稍早些的许多机器人项目,比如谷歌的HYDRA、英伟达的MimicGen等,也都采用了模仿人类的学习方式。

特斯拉机器人工程师Milan Kovac也具体介绍了这种技术路线的好处:

  • 验证当前的硬件能否胜任灵活地完成任务

  • 收集训练端到端神经网络的数据,准备转型全自动模式

  • 积累足够的数据多样性,更快泛化到更多任务

e2a78f78fbe8e04ded5e7ea93a13f7a9.webp

从模仿人类到完全自动执行一项任务,再到泛化到更多样的任务,成了智能机器人行业当今的大趋势。

也在短时间内集中爆发大量突破性成果,让机器人能执行的任务越来越接近实际需求。

技术有了发展,市场也给出积极回应。

优必选科技成为人形机器人第一股,历史上机器人首次参与了上市敲钟。

75a56aafc55ca4ba968c0a67f27d1c6c.webp

华为天才少年稚晖君创办的智元机器人估值超过10亿美元,火速晋升独角兽。

ae9b5149512acb2873c9b68af6b9f82c.webp

刚刚结束的科技盛会CES展上,机器人也是最火爆的。微软CEO纳德拉也到开普勒机器人展位参观,听取讲解还频频点头。

4133788a0749cddb116417067af4c597.webp

所以在AIGC元年,大模型元年之后,2024年真的会是人形机器人元年?

One More Thing

有网友介绍了另一种完全不同的机器人机器人:

叠衣服速度是特斯拉擎天柱的50倍,成本还能减少95%。

c14ee7f5214cc8d344a361d12ba0d743.webp

不过就只能做叠衣服这一种任务了。

889ea4a78b7a8c240f539961eb095677.webp

参考链接:
[1]
https://x.com/elonmusk/status/1746964887949934958
[2] https://x.com/_milankovac_/status/1746985297257304461

—  —

浏览 24
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报