来自engadget的消息称,麻省理工学院最新研究发布的的机器视觉系统可以让自行解决它所看到的问题。
对于反复执行特定动作的机器来说,目前的计算机视觉技术已经足够了,比如从装配线上取下一个物体,把它放到一个箱子里。,要让机器人变得足够有用,不仅能在仓库里装箱子,还能在我们自己的家里帮上忙,目前的而技术就显得力不从心了。
对此,麻省理工学院设计了“DON”系统。
DON,或称“密集物体网”,是麻省理工学院计算机科学和人工智能实验室(CSAIL)开发的一种新型机器视觉形式。它能够生成一个“可视化路线图”——即以坐标形式排列的可视化数据点的集合。这个系统会把这些单独的坐标集拼接成一个更大的坐标集合,就像您的手机可以将多张照片拼接成一个全景图像一样。这使得系统能够更好、更直观地理解对象的形状以及它在周围环境中的工作方式。
“从计算机视觉系统中得到的最粗糙、最高级的东西就是检测目标,”该研究论文的作者、博士生Lucas Manuelli告诉Engadget。“下一步是进行像素标记,所有的像素都是一个人或一条道路的一部分。很多自我驾驶汽车系统都会进行这两部操作。“
“但如果你真的想以某种特定的方式与某个物体互动,比如以特定的方式抓住鞋子或抓住一个杯子,”他继续说道,“那么仅仅有一个边界框或所有对应于杯子的像素是不够的。我们的系统必须得在对象中获得更精细的细节......这种信息对于进行更高级的操作任务是必要的。“
也就是说,DON系统可以让机器人看着一杯咖啡时,正确定位到咖啡杯的手柄上。当机器人拿起咖啡杯时,DON系统能让机器人意识到杯子的底部需要保持指向下方,以避免杯子里的东西洒出来。
更重要的是,该系统将允许机器人从一堆相似的物体中挑选出特定的物体。
“许多操纵方法无法让机器人在不同的方向上识别出物体的特定部分,”Manuelli在研究中写道,“例如,现有的算法无法通过手柄抓住马克杯,特别是当马克杯朝着不同的方向时。”
该系统依赖于拥有RGB深度相机组合的RGB-D传感器。并且,这个系统可以进行自我训练——如果你想让系统识别棕色的靴子,你只需把机器人放在一个有棕色靴子的房间里,然后这个系统将自动循环启动,获取用于生成坐标点的参考照片,然后根据所看到的内容进行自我训练。整个过程不到一个小时。
“在工厂中,机器人通常需要复杂的零件才能可靠地工作,”Manuelli写道,“但像这样一个能够理解物体方向的系统,只需拍张照片,就能相应地把握和调整物体。”
这项技术仍然处于起步阶段,Manuelli希望在不断完善后,能够到家庭的日常机器中,帮助人们更好地生活。