能够自主学习,无疑是机器人行业从业者努力的方向之一,近来谷歌的这项研究,可能为机器人行业提供了新的思路。
据外媒报道,近日,谷歌大脑展示了如何让机器人没有目标地“玩”也可以变得更聪明,也就是通过人工智能的智能模拟以及自动化操作,提升机器本身的能力,实现人工智能的操作。
谷歌通过模拟远程操纵机器人获得了一个数据集“Learning from Play data(LfP)”。在远程操作中,研究人员让机器人用机械手和机械臂与现实世界交互,没有具体的目标,希望能够通过无目标设定,从而实现机器人自我学习与可行性摸索,进一步提升机器人的人工智能。
之后,谷歌将这个数据集用于系统内,该系统试图对这些有趣的动作序列进行分类,并将它们映射到一个潜在的空间。,系统中的另一个模块试图查看潜在空间,并提出可以将机器人从其当前状态转换到其目标状态的动作序列,也就是普通人理解的,给了机器人一个完成结果的思路和方法,剩余就看机器人的自我发挥。
结果,谷歌将使用这个数据集的方法与使用行为克隆技术等方法做比较,结果发现使用LfP数据集的机器人表现更稳定,且在大部分任务中成功率都较高,说明机器人在完成内容方面,其实具有一定性质的自我学习能力。
有趣的是,研究人员还发现,使用LfP数据集训练的机器人在失败后会多次重新尝试完成任务,且在从未接受过任务标签训练的情况下,机器人的潜在规划空间会学会嵌入任务语义,也就是自我学习。
随着人工智能逐渐成为大方向,越来越多企业致力于从各方面提升机器人的能力,更好的服务于更多的企业和社会使用场景,谷歌的这项研究无疑代表了人工智能高度的可行性,也即通过潜在规划空间,全方位提升人工智能的可拓展能力。而自我学习如果能够进化到更高级程度,无疑就是人工智能的代表。
但最大的问题还是在于,简单潜在规划空间的延伸,依旧还是按照代码规律以及可行性延伸,进行程序执行和结果判断操作,本身并没有太多判断以及工业延伸的内容,朝着人工智能进一步转化,以及应用实践到工业上,该项发现的未来以及实践,仍然有非常大的空间,以及非常长的路要走。