几个月前,总部位于旧金山的初创公司OpenAI展示了一种名为“密集对象网”(Dense Object Nets,简称DON)的计算机视觉系统,该系统允许检查、视觉理解和操纵他们从未见过的对象。谷歌的研究人员解释说,这是基于对自我监督的认知发展研究。
人们通过与环境的互动来获取关于世界的知识,随着时间的推移,人们从他们所采取的行动的结果中学习。即使是抓住一个物体也能提供很多关于它的信息,例如,它必须在抓住之前的瞬间触手可及。
Jang和Devin写道,在机器人领域,这种学习方式得到了积极的研究,因为它使机器人系统能够在不需要大量训练数据或人工监督的情况下学习。通过这种形式的自我监督,机器人等可以通过场景中的视觉变化来识别物体。
该团队与公司合作,教授了一种可以无意识地抓住物体的机械臂,并在训练过程中学习各种物体的表现形式。这些表现最终导致研究者有意识地抓住研究人员选择的工具。
谷歌机器人
该团队利用强化学习一种人工智能训练技术,该技术使用系统驱动实现特定目标,以手臂抓住目标,用相机检查目标,并回答基本的目标识别问题(这些目标是否匹配)他们实现了一种感知系统,通过分析一系列的三幅图像,即抓取前的图像、抓取后的图像和被抓取对象的孤立视图,提取出关于物体的有意义的信息。
在测试中,Grasp2Vec和研究人员的新策略取得了80%的成功率,甚至在多个对象匹配目标和由多个对象组成的情况下也有效。”
他们写道,我们展示了机器人抓取技能如何生成用于学习以对象为中心的表示的数据。然后,我们可以使用表示学习来引导更复杂的技能,如实例抓取,保留我们的自主抓取系统的自监督学习特性。展望未来,我们不仅为机器学习能够通过更好的感知和控制给机器人带来什么而感到兴奋,也为机器人能够在新的自我监督范式下给机器学习带来什么而兴奋。