英伟达在GTC 2026开发者大会上发布了全新Groq 3语言处理单元,这是一款专为多智能体工作负载设计的推理芯片。该芯片基于英伟达200亿美元收购Groq公司的技术授权开发,专注于AI推理而非训练。Groq 3 LPX服务器机架包含256个LPU,提供128GB固态随机存取内存和每秒40PB带宽。与Vera Rubin NVL72机架配合使用,可将每兆瓦功率的吞吐量提升35倍,支持万亿参数模型和百万令牌上下文处理。
TPU与GPU之间的竞争正在重塑AI硬件市场格局。GPU基于并行处理,能处理多样化任务,而TPU专门针对张量矩阵运算进行优化。谷歌TPU采用类似RISC的设计理念,通过限制功能来提升特定运算效率。随着Meta计划在2027年采购数十亿美元的TPU芯片,Anthropic宣布使用百万TPU训练Claude模型,TPU生态系统正在获得发展动力,对英伟达的GPU霸主地位构成挑战。