谷歌发布基础世界模型Genie 能一图创建互动的虚拟环境

智能机器人 2025-02-15 12:25www.robotxin.com人工智能机器人网

科技日报记者张梦然报道，谷歌旗下“深度思维”公司近日发布了一项重大成果——Genie（精灵），一个基于互联网视频训练的基础世界模型。

据悉，Genie能够从合成图像、照片以及草图中生成多种动作可控的环境。这一技术的核心在于，它采用了生成式人工智能新范式，即通过单个图像提示即可生成交互式、动作可控的环境。这一创新无需人工监督，使得Genie能够自行识别视频中的动作特征和模式，学习各种角色的动作、控制和行动。

值得一提的是，Genie具备从互联网视频中学习细颗粒度控制的能力。它不仅能够观察出哪些部分是可控制的，还能根据生成的环境推测出多种潜在的动作。这一独特功能使得Genie在接收用户输入时更加智能和灵活。无论是AI合成的图像、照片还是草图，只需一张图像，Genie就能将其转换为可玩的游戏，响应用户的控件。从图像到基本的交互环境，一步到位。

用户只需提供简单的草图、完美的数字艺术作品，甚至是AI对2D世界的描述，Genie便能完成剩余的工作，为用户生成2D游戏。这项技术的适用领域广泛，不仅专注于2D平台游戏和机器人技术的视频，还可扩展至任何类型的领域以及更大的互联网数据集。只需一张图像，就能创造全新的交互环境，为进入虚拟世界开启了无数新的可能性。

谷歌官网称，Genie的发布代表着生成式人工智能的一大进步。这一技术的潜力巨大，未来有望在娱乐、教育、设计等领域发挥重要作用。随着技术的不断发展，我们有理由相信，Genie将为我们带来更多令人惊叹的创意和体验。

上一篇：700台聪明机器人成为生产车间主力军减少超过一半操作工人下一篇：联邦快递正在关闭其Roxo机器人送货测试计划

谷歌发布基础世界模型Genie 能一图创建互动的虚拟环境

人工智能机器人网搜索

人工智能机器人网导航

工业机器人

机器人培训

机器人技术