谷歌发布基础世界模型Genie 能一图创建互动的虚拟环境

行业资讯 2025-02-15 12:25www.robotxin.com人工智能机器人网

科技日报记者张梦然报道,谷歌旗下“深度思维”公司近日发布了一项重大成果——Genie(精灵),一个基于互联网视频训练的基础世界模型。

据悉,Genie能够从合成图像、照片以及草图中生成多种动作可控的环境。这一技术的核心在于,它采用了生成式人工智能新范式,即通过单个图像提示即可生成交互式、动作可控的环境。这一创新无需人工监督,使得Genie能够自行识别视频中的动作特征和模式,学习各种角色的动作、控制和行动。

值得一提的是,Genie具备从互联网视频中学习细颗粒度控制的能力。它不仅能够观察出哪些部分是可控制的,还能根据生成的环境推测出多种潜在的动作。这一独特功能使得Genie在接收用户输入时更加智能和灵活。无论是AI合成的图像、照片还是草图,只需一张图像,Genie就能将其转换为可玩的游戏,响应用户的控件。从图像到基本的交互环境,一步到位。

用户只需提供简单的草图、完美的数字艺术作品,甚至是AI对2D世界的描述,Genie便能完成剩余的工作,为用户生成2D游戏。这项技术的适用领域广泛,不仅专注于2D平台游戏和机器人技术的视频,还可扩展至任何类型的领域以及更大的互联网数据集。只需一张图像,就能创造全新的交互环境,为进入虚拟世界开启了无数新的可能性。

谷歌官网称,Genie的发布代表着生成式人工智能的一大进步。这一技术的潜力巨大,未来有望在娱乐、教育、设计等领域发挥重要作用。随着技术的不断发展,我们有理由相信,Genie将为我们带来更多令人惊叹的创意和体验。

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by