语言处理 关键字列表
英伟达200亿美元Groq技术加持新LPX机架系统 大幅提升AI响应速度

英伟达200亿美元Groq技术加持新LPX机架系统 大幅提升AI响应速度

英伟达在GTC大会上宣布,将使用价值200亿美元收购的Groq语言处理单元(LPU)技术,来提升新发布的Vera Rubin机架系统的AI推理性能。这项技术使英伟达能够以每用户每秒数百至数千个token的速度服务大型语言模型。LPU专门优化低延迟token生成,与GPU配合使用,GPU处理计算密集型提示处理,LPU负责快速生成响应。