谷歌 DeepMind MuZero 人工智能可以不学规则掌握游戏
早在 2016 年,AlphaGo 先后击败围棋世界冠军李世石、柯洁,这仅仅是 DeepMind 人工智能的初代版本,需要事先输入大量人类对弈数据、规则数据进行训练,然后才可以进行实战。AlphaGo 是首个能够利用、树状搜索完全掌握围棋的人工智能。
此后于 2017 年推出的第二代 AlphaGo Zero,能够不借助人类对弈数据,仅仅事先输入规则便可自行训练,最终掌握围棋。
谷歌第三代的人工智能 AlphaZero,不仅可以自主学会围棋,也仅仅依靠事先了解规则,掌握了国际象棋、日本将棋。
根据谷歌发表在《自然》杂志的文章显示,第四代人工智能 MuZero 可以在未知规则的情况下学会上述四种棋类,规划制胜策略。,还能够掌握掌机游戏 Atari。
DeepMind 公司表示,多年来研究人员一直在寻找一种方法,既可以学习建立用于解释目前环境的模型,也能够利用这个模型来进行最好的决策。直到今天,大多数方法都难以在 Atari 这种游戏中进行有效规划。
MuZero 在 2019 年推出,通过只关注环境中最重要的一个方面,来学习建立一个模型,并解决问题。通过将这种方法与 AlphaZero 强大的搜索树技术相结合,MuZero 的能力实现了重大飞跃。,MuZero 还利用了前瞻搜索、基于模型的规划来解决问题。具体来说,MuZero 对环境中至关重要的三个问题来计划
价值现在所处的位置有多好?
策略哪一种行动是最好的?
奖励一步的动作结果有多好?
IT之家了解到,Atari 公司于 1976 年在美国推出了 Atari 2600 游戏机,这是史上第一部真正意义上的家用游戏主机,其整个生命周期持续到 1992 年,共售出三千万台。
机器人技术
- 800多家中国机器人企业近半无产品
- 看看机器人在和你抢什么
- 马化腾、李彦宏等科技企业大佬们在贵阳大数据
- 机器人投入汽车产业园 探索机器人产业链
- 特斯拉 Cybertruck 电动皮卡换上黑色外衣,有望为
- 沁峰如何成为冲压机器人细分赛道国家专精特新
- 运动机器人智障了吗?
- Rivian 将投资 50 亿美元在佐治亚州建造电动汽车工
- 调查发布 - 制造业在疫情防控常态化下突围——
- 未来工业机器人的市场什么样的变化
- 进博会特斯拉展台最全预测 沉浸式体验智能制造
- 美国将中国电动汽车关税提高到 100%,极星 CEO 对
- DeepMind 联合创始人:交互式 AI 才会“改变人类”
- 把握发展趋势 推动机器人产业高质量发展
- AI入侵教师职业,这五类产品发展迅猛
- 他们用AI和食用植物创造“人工肉食”,你想尝尝