加州大学研究:通过模仿及无监督经验,机器人
BAIR 博客文章指出,去年底 BAIR 完成一项研究工作,是让机器人在无监督学习的情况下与环境交互,进而建立一个可预测因果关系的视觉模型,基于这个学习模型,机器人可以完成一些简单的任务,包括叠衣服、摆放物体、或是用毛巾把物体遮盖起来等。,如果要加入使用工具,以实现更复杂的互动时,如拿扫帚把垃圾扫入簸箕里,就显得不足。
BAIR 研究人员进一步指出,许多动物利用观察和实验可以学会如何使用工具,比如通过观察彼此,黑猩猩知道如何使用树枝来捕抓白蚁,卷尾猴也懂得拿棍棒把食物“扫”过来,靠近自己,方便拿取,诸如此类使用工具的能力其实代表更高水平的智力。
,他们从动物的学习方式取得灵感,展开了进一步的研究让机器人像人类一样,通过观察和实验来使用工具。通过设计出允许机器人通过类似模仿和互动模式的算法,来掌握使用工具的技能,机器人不仅学会了把从没见过的物体拿来当作工具,加以使用,甚至在没有传统工具可用的情况下,以“即兴物品”来替代,例如,没有扫帚时,推断出瓶子等普通物品,也可作为工具使用,会更有效率地完成任务。
图|机器人学会把不同的物体当作工具使用,以达到指定的任务,比如利用小扫帚将圆型物体推向黄色箭头方向(来源BAIR)
,他们先示范如何使用各个不同工具,每一次演示,都会把机器人摄像头、抓手夹具位置等连续动作的图像记录下来,并利用这些数据建立一个动作提议模型,使机器人能够把当前场景中的物体当作工具来使用。
但光是这样还不够,目前外界对于机器人的期待是可以做出超越演示的表现,例如遇到没见过的东西,也要懂得判断如何处理或应对,才能让机器人技术进一步泛化到新的物体和新的场景下,如此就需要有大量不同的数据,,BAIR 研究人员通过让机器人能自行收集数据来扩展其经验。机器人以两种不同的方式自主收集数据,一是采取随机的动作序列,二是从上述的动作提议模型中抽样,机器人可抓取工具,并随机移动。
而整个数据集包括专家演示、机器人对各种工具的无监督经验,以及 BAIR 机器人交互数据集(BAIR Robot Interaction Dataset)的数据,研究人员使用整个数据集来训练动力学模型。
图|机器人在无监督情况下自行与不同的物体进行交互 (来源BAIR)
在测试时,机器人可以使用模仿训练的模型来规划过程,预测模型则会用来决定机器人可做出哪些动作来执行任务。当用户指定任务时,并不会告诉机器人如何使用工具、或是有哪些备选工具可以使用,机器人必须在规划过程中自己弄清楚。
图|机器人之前从未见过海绵,也能够知道如何使用它来清除盘子上的东西(来源BAIR)
图|因为机器人只允许在绿色区域内移动,它懂得利用L形钩来移动蓝色圆柱,而不会跨越绿色区域范围(来源BAIR)
图|遇到瓶子时,机器人也推断出可以利用它来完成任务(来源BAIR)
BAIR 指出,处理过去不曾见过的物体,一直是机器人执行任务时很大的挑战,为了研究这个问题,他们结合了模仿和自我监督的交互,并通过上述的演示,让机器人能够使用多个物体来完成复杂的多对象任务,甚至可以在新场景下使用即兴工具,这项研究工作有助于让机器人更加通用,在日常环境中执行实际的任务。
机器人技术
- 800多家中国机器人企业近半无产品
- 看看机器人在和你抢什么
- 马化腾、李彦宏等科技企业大佬们在贵阳大数据
- 机器人投入汽车产业园 探索机器人产业链
- 特斯拉 Cybertruck 电动皮卡换上黑色外衣,有望为
- 沁峰如何成为冲压机器人细分赛道国家专精特新
- 运动机器人智障了吗?
- Rivian 将投资 50 亿美元在佐治亚州建造电动汽车工
- 调查发布 - 制造业在疫情防控常态化下突围——
- 未来工业机器人的市场什么样的变化
- 进博会特斯拉展台最全预测 沉浸式体验智能制造
- 美国将中国电动汽车关税提高到 100%,极星 CEO 对
- DeepMind 联合创始人:交互式 AI 才会“改变人类”
- 把握发展趋势 推动机器人产业高质量发展
- AI入侵教师职业,这五类产品发展迅猛
- 他们用AI和食用植物创造“人工肉食”,你想尝尝