美陆军开发出高效机器人训练模型
美国陆军研发新机器人学习模型,赋能未来战场
在未来多域作战的构想中,美国陆军已经跨出了一大步。他们研发了一种基于强化学习的地面机器人学习模型,这一创新策略旨在减少训练强化学习策略的不可预测性,让自主智能体能够在瞬息万变的战场环境中进行推理和适应。
强化学习是一种智能体通过“试错”来学习的模式,通过与环境的交互获得的奖赏来指导其行为,目标是使智能体获得最大的奖赏。这一技术在解决复杂问题上表现出强大的能力,近年来在围棋、象棋、电子游戏等领域取得了显著进展。将强化学习应用于地面机器人时,美国陆军面临两大挑战。
首先是算法的限制。策略梯度方法是强化学习中的基础,但在连续空间中,现有技术尚不支持更广泛的决策目标,如风险敏感性、安全约束以及对先验知识的和发散。其次是数据问题。强化学习需要大量的样本复杂性,而现有的多域作战概念和下一代战斗车辆项目并不支持当前的训练机制。
在多域作战和NGCV项目中应用强化学习时,必须提高样本效率和可靠性。美国陆军研究实验室取得了重大突破,通过将现有的策略搜索方案推广为通用工具。研究人员为这一通用程序开发了新的策略搜索方案,并确定了其样本复杂度。新的策略搜索方案降低了奖励积累的波动性,并形成了对未知领域的有效和先验机制。这对于地面机器人来说至关重要,因为获取数据的成本很高。
这项研究不仅为强化学习中的策略梯度定理做出了贡献,还为未来的战场侦察、和风险评估提供了新的可能。装备有强化学习功能的自主机器人将在未来战场上发挥重要作用。研究人员正计划将更广泛的决策目标纳入多主体设置,并研究强化学习主体之间的交互如何产生协同和对抗性推理。
这项创新是美国陆军研究实验室的一项重要成果,反映了其在科技领域的持续进步和对未来的。文中观点不代表本公众号立场,相关建议仅供参考,转载时请注明出处“国防科技要闻”。作者白子龙来自北方科技信息研究所,编辑是陈培。
工业机器人
- 美陆军开发出高效机器人训练模型
- 扫地机器人会磨地面吗
- 万能机器人的作者是
- 多行业加速部署 全球机器人研发支出将大幅增长
- 3D打印水母机器人可用于跟踪和监测世界海洋中濒
- Adobe Stock图库将允许AI生成的图片出现在其服务上
- 中国第一个机器人美女价格
- 机器人培训机构云端引才瞄准机器人产业
- 丰田进军家用机器人市场,与日本顶级AI创业公司
- 韩国在机器人利用率上居世界第一位但在制造技
- 拍CT不用摘口罩不用医生协助,AI系统海淀医院上
- 多国网络安全厂商抨击美英监听计划
- 2025年工业移动机器人数据内参资料
- 郑州:校园创客研发出手语翻译机器人
- 雄克CIBF2023电池展新风采创新技术 卓越展现
- 电网有了机器人医生(RPA) 它是怎么看病的