最近,在伯克利的一个实验室里,一个叫凯西的机器人自学了走路,有点像蹒跚学步的孩子。通过反复试验,它学会了在模拟世界中移动。然后,它的主人让它在一个雷区里溜达,看看它的真实情况如何。

事实证明,它的表现相当不错。无需进一步的调整,这个机器人——基本上只是一双腿——能够向各个方向行走,行走时蹲着,失去平衡时恢复正常,并适应不同的表面。

这是被称为强化学习的机器学习方法首次如此成功地应用于两条腿的机器人。

这可能不是您所看到的第一个机器人视频,也不是最抛光的机器人视频。

多年来,互联网一直被机器人做的远远不止行走和恢复平衡的视频所吸引。现在所有这些都是赌桌上的赌注。重量级机器人视频冠军波士顿动力公司定期发布令人兴奋的机器人跑酷视频,后空翻,复杂的舞蹈动作。有时,它看起来像是世界iRobot公司就在拐角处。

这种敬畏的感觉是充分利用的。波士顿动力学是世界上先进机器人的顶级制造商之一。

但他们还是得这么做精心的手程序和编舞的动作他们视频里的机器人。这是一个强大的方法,波士顿动力团队已经用它做了很多不可思议的事情。

然而,在现实世界中,机器人需要健壮和弹性。他们需要定期处理意外,再多的编排也无济于事。人们希望机器学习能帮上忙。

最著名的是,Alphabet的DeepMind利用强化学习来训练算法在一些最艰难的比赛中捶打人类。简单地说,它是以我们学习的方式为模型的。碰炉子,就会被烫伤,别再碰那该死的东西;说“请”,拿一个糖豆,礼貌地再要一个。

在Cassie的案例中,伯克利的研究小组使用强化学习来训练算法在模拟中行走。这并不是第一个以这种方式走路的人工智能。但是从模拟到现实世界并不总是有效的。

这两者之间的细微差别可能会(字面上)绊倒一个新手机器人,因为它第一次尝试它的模拟技能。

为了克服这个挑战,研究人员使用了两个模拟,而不是一个。第一次模拟是在一个名为MuJoCo的开源训练环境中,算法利用了大量可能的动作库,并通过反复试验学会了如何应用它们。第二个模拟名为Matlab SimMechanics,作为一个低风险的试验场,更精确地匹配现实世界的条件。

一旦算法足够好,就会升级到凯西。

令人惊讶的是,它不需要进一步打磨。换句话说,当它出生在现实世界时,它知道如何行走。此外,它也相当健壮。研究人员写道,在实验中,Cassie膝盖上的两个马达失灵了,但机器人能够调整并继续前行。

其他实验室也在努力将机器学习应用于机器人技术。

去年谷歌使用强化学习来训练(更简单的)四足机器人。OpenAI将其用于机械臂。波士顿动力学也可能探索方法用机器学习来增强他们的机器人。新方法这个旨在培训多技能机器人或这个提供培训之外的持续学习——也可能改变形势。然而,现在还为时过早,还不知道机器学习何时会超越传统方法。

与此同时,波士顿动力公司的机器人测试商业水域

不过,不是伯克利团队成员的机器人研究人员认为这种方法很有前途。伦敦帝国理工学院机器人学习实验室主任爱德华·约翰斯表示,告诉麻省理工学院技术评论“这是我看到的最成功的例子之一。”

伯克利的团队希望通过尝试“更动态和敏捷的行为”来取得成功。那么,一个自学跑酷的凯西会来找我们吗?我们将会看到。

图像信用:加州大学伯克利分校混合机器人通过YouTube

Jason是Singularity Hub的总编辑。斯洛伐克捷克比分直播在转向科学技术之前,他做过金融和经济方面的研究和写作。他对几乎所有的事情都很好奇,可悲的是他只知道其中的一小部分。