机器人赛道有多火?有人刚融10亿,字节美团布局,还有AI科学家晒成果

生活知识 2024-12-26 15:08www.robotxin.com生活百科

近期,知名美籍华裔人工智能学者李飞飞领导的项目组发布了一项最新的“具身智能”成果——VoxPoser,这让人们不禁回想起童年中那些关于机器人的美好记忆。

你是否也曾沉浸在阿诺德·施瓦辛格饰演的T-800终结者的科幻电影中,被那独立行动能力的机器人所吸引?如今,电影中的幻想已经逐渐变为现实。距离那部由好莱坞鬼才导演詹姆斯·卡梅隆执导的科幻电影《终结者》上映已近40年,科学家们真的将具有行动能力的机器人带到了我们的生活中。

VoxPoser项目的主要研究目标是在给定开放式指令集和对象集的情况下,为各种操作任务合成机器人轨迹。它能够从大语言模型和视觉-语言模型中提取机会和约束,构建3D值地图,让机器人在零样本学习的情况下,理解指令,分解任务,规划路径,并最终实现操作任务。值得一提的是,该方法在进行机器人操控时,无需进行数据投喂和预训练。

关于VoxPoser的具体工作原理,可以说是相当引人入胜。使用者只需提供执行具体需求的自然语言指令以及环境信息(通过相机采集的RGB-D图像)。LLM(大语言模型)将根据这些信息生成与VLM(视觉-语言模型)交互的代码。基于这一系列操作,机器人便能够自动生成相应的“3D值图”,完成空间感知。这一成果的最大亮点在于,整个机器人训练过程中无需进行任何额外的数据投喂和预训练。

项目团队为了验证VoxPoser的能力,进行了大量实验。通过下达日常操作任务,如“把毛巾挂在架子上”、“把最上面的抽屉关上”等,对VoxPoser进行了严格的测试。在实验中,团队还故意打断任务执行,以展示该成果在动态扰动下的鲁棒性。

VoPoser的出色表现得到了充分的验证。比如当对机器人发出“把垃圾纸分类到蓝色托盘里”的指令时,无论如何对机器人进行干扰,它都能顺利完成任务。论文指出,无论是在真实领域还是模拟领域,VoPoser的实验结果都显著优于基线任务。在真实环境下,VoPoser表现得更加灵活和稳健,特别是在外部干扰的情况下。

VoxPoser正是人工智能和机器人领域融合的一个新的里程碑。它让抽象的AI变得具象化,未来可能带来真正的具身智能机器人。这一成果的发布无疑为我们描绘了一个充满科技与奇幻的未来世界,令人期待。VoPoser展现出了卓越的学习能力,特别是在零样本下的表现更是令人瞩目。其独特的优势不仅在于此,论文中还详细阐述了VoPoser所涌现的四大新能力。

它具备估算物理属性的能力。想象一下,面对两个未知质量的方块,VoPoser能够利用现有工具进行物理实验,准确判断哪个方块更重。常识性行为推理也是其强项。例如,在摆桌子的任务中,用户若指定行为偏好如“我是左撇子”,VoPoser能够理解并适应这一习惯。细粒度语言校正功能使得VoPoser能够处理高精度的任务指令。例如,当用户指出“你离目标有1厘米的偏差”时,VoPoser能够精确调整自己的动作。多步骤视觉操作是VoPoser的另一大亮点。在面对复杂任务时,如“精确地将抽屉打开一半”,VoPoser能够根据视觉反馈制定多步骤策略,确保任务的高效完成。

VoPoser的诞生并非偶然,而是计算机视觉与具身智能相结合的产物。具身智能,即Embodied Intelligence(EI),这一概念早在图灵的论文《Computing Machinery and Intelligence》中就被提出。具身智能让机器能够像人一样感知环境、自主规划、决策并行动,这也是人工智能的终极形态之一。李飞飞曾指出,具身智能将会是AI领域的下一个重要方向。这一观点得到了英伟达首席执行官黄仁勋的共鸣,他在ITF World 2023半导体大会上表示,“AI的下一个浪潮将是具身智能”。

在AI与机器人融合的巨大想象空间下,微软、谷歌等科技巨头也纷纷涉足其中。微软发布了一篇论文,探索将ChatGPT的功能扩展到机器人领域。谷歌则推出了一个参数达5620亿的具身多模态语言模型——PaLM-E,使机器人具备了“听懂人话”的能力。国内的世界人工智能大会上,智能机器人成为了除AIGC之外的另一大亮点。众多企业展示了他们的具身智能服务机器人解决方案。例如,达闼的人形机器人小姜下一代Cloud Ginger 2.0以及云深处科技的四足机器人绝影Lite3和工业级绝影X20多传感融合版等。这些机器人的出现,标志着具身智能在各个领域的应用正逐渐展开。

与此越来越多的跨界选手也加入了这场追逐具身智能的风口。互联网科技企业如网易、字节跳动、京东、美团等纷纷投资成立专业机器人业务公司,共同推动这一领域的发展。随着技术的不断进步和应用的不断拓展,具身智能将会开启AI的下一个浪潮,为我们的生活带来更多便利和惊喜。随着科技的飞速发展,人工智能领域的热潮不断涌现。最近,杭州网易轩之辕智能科技有限公司和网易牵波智能科技(杭州)有限公司相继成立,进一步推动了智能机器人的研发与人工智能应用软件的深度融合。这两家新成立的公司不仅继承了网易一贯的技术创新精神,更展现了其在人工智能领域的坚定投入和远大布局。

早在2017年,网易就率先成立了网易伏羲,并在本届WAIC上展示了其具身智能工程机器人的惊艳实力。这一举动不仅彰显了网易在人工智能领域的深厚积累,更预示着人工智能技术的飞速发展将助力智能机器人行业的突飞猛进。

而在人工智能领域的竞争之中,字节跳动也不甘示弱。最近传出消息,该公司也将涉足机器人领域,其机器人团队已经集结了五十余人,并计划在年底扩充至百人以上。字节机器人团队将隶属于字节AI Lab,由经验丰富的总监李航领导,共同探索机器人技术的未来。

虽然京东目前没有新的机器人公司成立的消息,但其集团旗下的京东云计算有限公司已经进行了工商变更,经营范围新增了智能机器人研发等。这一变化预示着京东也将进一步涉足机器人领域,与人工智能深度融合,共同推动行业的发展。

在传统行业中,碧桂园、中国石化等巨头也纷纷躬身入局机器人领域。其中,碧桂园早已在机器人赛道上占据一席之地;而中国石化销售股份有限公司与航天云机(北京)科技有限公司联手成立的易嘉油智能机器人有限公司,则专注于服务消费机器人制造和研发。

机器人已从科幻电影中走进现实,成为人类社会发展的重要组成部分。WAIC的影响使得机器人赛道持续火热,也引起了资本领域的极大兴趣。据中国电子学会预测,到2024年,全球机器人市场规模有望突破650亿美元。随着AI大模型和机器人的深度融合,更智能、更先进的机器人将成为新一轮的创新风口。这一趋势不仅展现了科技的巨大潜力,也预示着未来社会的无限可能。

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by