世界模型 关键字列表
DeepMind发布Genie 3"世界模型",实现实时交互式模拟环境

DeepMind发布Genie 3"世界模型",实现实时交互式模拟环境

谷歌DeepMind推出Genie 3"世界模型",仅需提示词或图像即可创建交互式世界。该模型支持720p分辨率24帧每秒的实时渲染,相比前代产品显著提升了视觉保真度和记忆能力,可保持数分钟的视觉一致性。用户能够实时修改环境、添加对象、改变天气或插入新角色。DeepMind将其视为AI研究工具,用于训练embodied agents并生成合成训练数据。尽管仍存在局限性如无法模拟真实地点、易产生AI幻觉等,但该技术为游戏开发和AGI研究提供了新可能性。

产业丨谷歌成立新团队模拟物理世界AI模型

产业丨谷歌成立新团队模拟物理世界AI模型

谷歌DeepMind部门整合人工智能团队,专注于开发能模拟物理世界的先进AI大模型。新团队由前OpenAI项目负责人领衔,将提升AI对现实世界的认知和模拟能力。Genie 2模型能从单一图像构建交互3D环境,支持长视频内容生成等。科技巨头争夺世界模型开发,预示AI技术在游戏、影视、机器人等领域的广泛应用。