谷歌DeepMind推出Genie 3"世界模型",仅需提示词或图像即可创建交互式世界。该模型支持720p分辨率24帧每秒的实时渲染,相比前代产品显著提升了视觉保真度和记忆能力,可保持数分钟的视觉一致性。用户能够实时修改环境、添加对象、改变天气或插入新角色。DeepMind将其视为AI研究工具,用于训练embodied agents并生成合成训练数据。尽管仍存在局限性如无法模拟真实地点、易产生AI幻觉等,但该技术为游戏开发和AGI研究提供了新可能性。
谷歌DeepMind部门整合人工智能团队,专注于开发能模拟物理世界的先进AI大模型。新团队由前OpenAI项目负责人领衔,将提升AI对现实世界的认知和模拟能力。Genie 2模型能从单一图像构建交互3D环境,支持长视频内容生成等。科技巨头争夺世界模型开发,预示AI技术在游戏、影视、机器人等领域的广泛应用。