玩冰壶也在行?投掷冰壶的机器人组合,3:2击败韩国国家队选手
共 1539字,需浏览 4分钟
·
2020-10-03 02:54
新智元报道
新智元报道
来源:wired
编辑:小匀
【新智元导读】冰壶是一个「细致入微」的运动项目,掌握这门运动需要巧妙的技巧与策略。在近日Science的子刊《科学-机器人》中,来自韩国和柏林的研究人员训练了一组机器人Curly,它们在比赛中击败了韩国国家队队员,又是一个AI胜出的人机大战!
在很多体育项目中,机器人都取得了不凡的成绩。例如,在棋类等领域,已经有许多出手不凡能战胜专业选手的AI了。
最近,Science子刊《科学-机器人》上发表了一篇研究,一个名为Curly的机器人刚刚掌握了冰壶运动的技巧,就击败了两个韩国国家队。
与现实世界精确交互
高丽大学的研究人员位于首尔和柏林技术学院的研究人员设计了Curly,以测试「人工智能系统与高度不稳定的现实世界场景交互」。
换句话说,Curly能够观察现实世界,然后以精确而战略性的方式采取相应行动。
实际上,Curly是一个由两个机器人组成的团队,其中一个机器人观察得分位置,而另一个则负责完成投掷。虽然,目前没有其他机器人来完成磨冰动作,但再造一个这样的磨冰机器人也不是不可能。
Curly的形状有点像一个扁平的泪珠,有两个前轮和一个后轮。考虑到人类在冰上行走已经够困难的了,更不用说机器人了,所以,研究人员给Curly加了轮子。机器人还配备了两个摄像头,其中一个高达7英尺,这可以让机器人看到各方位的全景,而另一个则在它的前轮上方。
又是深度强化学习?
Curly的四个小轮子排成U形,前轮用于抓住冰壶,它们由传送带提供动力,传送带使冰壶旋转,就像人类玩家的操作一样,当沿顺时针旋转时,冰壶会向右卷曲;逆时针旋转则向左。
Curly的程序完全通过电脑游戏来进行训练,和很多「人机大战」的技术一样,Curly使用的也是「深度强化学习技术」,这能在程序边纠正自己的错误边改进。
深度强化学习在很多决策领域当中都取得了比较不错的结果,尤其是在游戏,多个游戏已经达到甚至是超过了人类水平。
基于深度强化学习,DeepMind研发的AlphaGo Zero在不使用任何人类围棋数据的前提下,在围棋上完虐人类;OpenAI研发的Dota Five则在Dota游戏上达到了人类玩家的顶尖水平;DeepMind研发的AlphaStar在星际争霸游戏上同样击败了人类职业玩家。
3:1!Curly赢了职业选手
在训练时,冰壶和冰都是用物理模型来模拟的。这样,研究人员就可以观察训练的情况如何,当然,这取决于模型的精准性。结果证明,训练的效果非常好,Curly只需要在每一场比赛的开始投一次冰壶,就能熟悉不同的情况,比如冰面是否足够光滑让冰壶划走。
Curly果然不负众望,在四轮比赛中赢了三场。但也有人发出质疑,如果加入擦扫冰面的条件出现,但对于一个机器人来说,这个成就已经非常值得骄傲了。
研究人员指出,这是一项重要的成就,不仅因为这证明了机器人在这项运动中具有竞争力,这项研究也涉及未来现实世界中实时的动态观察和决策。
因此,对于AI和机器人而言,这都是一个里程碑,而且对在模拟环境中训练此类机器人大有帮助。因为尽管在这几年,类似的研究还不足以达到这么明显的效果。
推荐阅读:
参考链接:
https://www.wired.com/story/meet-curly-the-curling-robot-that-beats-the-pros/