低延迟推理优化 关键字列表
未来游戏中的AI队友真的会听你说话

未来游戏中的AI队友真的会听你说话

育碧在Nvidia GTC 2026开发者大会上展示了实验性原型"Teammates",通过生成式AI替代传统预设NPC,让虚拟队友能够理解自然语言指令并实时回应。为解决LLM推理延迟问题,团队采用更快的基础模型、流式传输和提示词优化三项策略,将响应时间从3秒压缩至1.5秒。该平台以C++ SDK为核心,可无缝接入育碧自研引擎,支持云端与本地GPU双模式部署。