实时交互 关键字列表
谷歌推出Genie 3世界模型,可实时动态修改模拟环境状态

谷歌推出Genie 3世界模型,可实时动态修改模拟环境状态

谷歌DeepMind发布新一代世界模型Genie 3,相比前代产品实现多项关键提升。新模型支持720p分辨率输出,可持续运行数分钟而不产生伪影,并首次支持实时交互和文本提示功能,用户可通过文本指令动态改变模拟世界状态。DeepMind将其定位为AI智能体训练工具,可用于自动驾驶等场景的"假如"情况训练,提高模型可靠性。

Google 推出 Gemini 实时 AI 视频功能

Google 推出 Gemini 实时 AI 视频功能

Google 正式向用户推出 Gemini Live 的新 AI 功能,让用户能够通过手机屏幕或摄像头实时与 AI 进行交互。这项源自 "Project Astra" 的技术,可以实时解读视频内容并回答相关问题。目前该功能已向 Google One AI Premium 计划的 Gemini Advanced 订阅用户开放,展现了 Google 在 AI 助手领域的领先地位。

令人惊叹又不安的超逼真 AI 语音演示

令人惊叹又不安的超逼真 AI 语音演示

一段令人惊叹又让人不安的AI语音演示在网上引发热议。2013年,斯派克·琼斯的电影《她》描绘了一个人们与AI语音助手建立情感联系的未来。近12年后,AI初创公司Sesame发布的新对话语音模型使这一虚构的设想更接近现实,许多用户对此感到既着迷又不安。