机器人学走路很难吗?英伟达联手瑞士大学利用虚拟障碍快速训练
在人类的世界里,用腿行走似乎是一种本能,跃过障碍、攀爬斜坡或楼梯,都是轻而易举的事情。但对于机器人,尤其是像波士顿动力公司的Spot这样的四条腿机器人来说,学习正确的行走方式却是一项巨大的挑战。美国芯片巨头英伟达正与瑞士苏黎世联邦理工学院的研究人员联手,利用虚拟障碍课程训练名为ANYmals的四足机器人,为机器学习领域带来了新的可能性。
想象一下,4000多个类似狗狗的机器人浩浩荡荡向前行进的场景,即使在模拟中,也给人一种隐约的威胁感。这个虚拟机器人军团是由瑞士苏黎世联邦理工学院和英伟达共同开发的。他们使用虚拟环境来训练机器人,探索出一种独特的算法,并将其应用于现实世界中机器人的行走控制。
在模拟环境中,ANYmals机器人面临着各种各样的挑战,如穿越斜坡、攀爬台阶和陡峭的山坡。每当机器人成功克服这些挑战时,它们会面临更困难的关卡,推动控制算法不断进化。虽然机器人在上下楼梯方面掌握得很快,但面对更复杂的障碍物时,需要更长时间的训练。尤其是应对斜坡的挑战被证明特别困难,尽管有些虚拟机器人已经学会了如何滑下斜坡。
当最终的算法被应用到真实的ANYmal机器人上时,它能够在楼梯和街区之间自如导航。在更高速度下,它遇到了一些问题。ANYmal是一种四条腿的机器人,体型与狗狗相当,头上配有传感器,还有一个可拆卸的机械臂。研究人员认为,这可能是因为在真实世界中,传感器的感知方式与模拟环境相比还存在一定的不准确性。
这一研究不仅展示了机器人在模拟环境中的学习能力,也揭示了现实与虚拟世界的差异对机器人技术的影响。随着研究的深入,我们期待看到更多关于ANYmal机器人在未来挑战中的表现,以及它为机器学习领域带来的新突破。机器人的全方位学习与未来应用
通过一系列训练,机器人已经掌握了从简单的包裹分拣到复杂的庄稼收割等技能。这些技能的习得,不仅展示了机器人学习的巨大潜力,更反映出模拟和定制计算机芯片在人工智能未来发展中的重要性。这一项目的进展不仅关乎技术层面,更是对实际应用产生深远影响。
加州大学伯克利分校的教授、同时也是CoVariant联合创始人的皮特·阿贝尔对此表示赞同。他指出,从更高的视角来看,快速模拟真的是一项激动人心的工作。CoVariant公司正是利用AI和模拟技术训练机器人手臂,为物流公司完成物品的分拣工作。阿贝尔还提到,瑞士苏黎世联邦理工学院和英伟达的研究人员在提速方面取得了显著的进展。
人工智能在训练机器人完成真实世界任务方面展现出了巨大的潜力。这些任务复杂多变,难以通过传统编程来完成,需要机器人的某种自适应能力。比如抓取形状不规则、表面滑溜或是完全陌生的物体,这些都是编程难以预设的情况。
为了应对这些挑战,4000个模拟机器人接受了强化学习的训练。这种训练方法源于对动物如何通过正反馈和负反馈进行学习的研究。当机器人移动其“腿”时,一个精明的算法会判断这些动作对机器人行走能力的影响,并据此调整控制算法。
值得一提的是,这些模拟训练是在英伟达的专用AI芯片上进行的,而非传统的计算机和服务器中的通用芯片。这使得研究人员能够在不到通常所需时间的百分之一的时间里完成机器人的训练。这不仅提高了效率,还为机器人技术的实际应用提供了更广阔的空间。未来,随着技术的不断进步,我们期待看到更多机器人与人类共同工作,共同创造更美好的生活场景。英伟达芯片以其出色的图形渲染和神经网络计算能力而闻名,在面对模拟物理特性的挑战时,这些芯片却显得捉襟见肘。模拟攀登和滑动等动作时,研究人员不得不借助精妙的软件变通方案来应对。英伟达负责模拟技术的副总裁雷夫·勒巴雷迪安坦言:“我们经历了漫长的探索过程才取得如今的成果。”
随着技术的不断进步,模拟、人工智能和专用芯片的结合有望推动机器人智能的飞跃。英伟达已经开发出软件工具,极大地简化了在其芯片上模拟和控制工业机器人的过程。该公司在西雅图设立了机器人研究实验室,并销售适用于自动驾驶汽车的芯片和软件,致力于推动机器人技术的创新。
Unity Technologies公司,一家专注于开发视频游戏软件的企业,也涉足机器人软件领域。该公司注意到许多研究人员使用其软件进行模拟,于是致力于提升软件的逼真度并增强其与其他机器人软件的兼容性。Unity Technologies正与瑞典Algoryx公司合作,共同探索强化学习与模拟在训练林业机器人拾取原木方面的应用。
强化学习虽然已有几十年的发展历史,但得益于其他技术的不断进步,近年来其在人工智能领域取得了许多里程碑式的成果。随着研究的深入和技术的完善,强化学习将在机器人智能提升方面发挥越来越重要的作用。在2015年,强化学习被巧妙运用,训练计算机执行围棋任务。如今,这项技术已走出实验室,承担起芯片设计自动化的重任,这背后需要的是丰富的经验和敏锐的判断力。这种学习方法的应用需要庞大的数据支持和时间成本。
以Open AI公司为例,他们花费了超过14天的时间,通过强化学习训练一只机械手进行魔方操作。每当机器人需要再培训时,都需要等待两周的时间,这无疑增加了企业使用机器人的门槛。早期的机器人训练研究已经找到了分散学习过程的方法,通过将训练分散到多个现实世界的机器人上,结合物理模拟的改进,使得在虚拟环境中加速学习成为可能。
麻省理工学院的学生安德鲁·斯皮尔伯格对这项新工作充满热情。他曾使用类似的模拟方法为机器人提供新的物理设计。他指出,谷歌的研究团队已经走在了前列,他们通过将机器人的学习部分拆分,并在特制的张量处理单元芯片上运行,显著提高了机器人的学习速度。
塔利·福特在开放机器人基金会管理着机器人操作系统。他认为模拟对商业用户来说变得越来越重要,能够在部署到硬件之前在现实场景中验证软件,可以节省大量的时间和金钱。模拟不仅可以让程序运行得更快,而且永远不会对机器人造成损害。一旦出错,它可以迅速自动重置。
将机器人学习转移到现实世界中仍然面临巨大的挑战。现实世界中的不确定因素远比模拟环境复杂得多,例如污垢、光线、天气、硬件的不均匀性以及磨损等,这些因素都需要被追踪和考虑。尽管如此,随着技术的不断进步,我们有望克服这些挑战,让机器人在现实世界中展现出更加强大的能力。英伟达副总裁勒巴雷迪安近日表示,模拟技术对于训练行走机器人具有重要影响,而这种影响可能会进一步延伸到相关算法的设计上。他强调,虚拟世界对于众多领域都具有巨大价值,但其中最关键的莫过于为人工智能(AI)打造一个理想的游乐场或训练场。通过这种模拟环境,我们可以更好地模拟真实世界中的各种场景,从而帮助行走机器人在未来能够更好地适应和应对各种复杂情况。这一观点不仅体现了现代科技的创新理念,也预示着AI技术将在未来得到更为广泛的应用和发展。对此,腾讯科技审校专家金鹿也给予了高度评价。