英伟达发布Groq 3 LPX推理加速器,结合Vera Rubin GPU架构,专为万亿参数模型和百万token上下文优化。该技术可实现每兆瓦高达35倍推理吞吐量提升,并带来10倍收入机会。新架构采用分离式推理方式,GPU处理预填充阶段,LPX处理延迟敏感的解码阶段,显著降低延迟。分析师认为这代表了从AI训练向生产推理的范式转变,但企业应评估实际需求和成本效益。
英伟达发布新款Rubin CPX GPU,专为大规模上下文处理而设计,可支持百万级token的软件编程和生成视频。该产品将搭载于Vera Rubin NVL 144 CPX平台,承诺高能效和卓越推理性能,每投资1亿美元可获得50亿美元token收入。同时,英伟达展示了Blackwell Ultra GB300系统的基准测试结果,DeepSeek-R1推理性能较前代提升1.4倍。
中国AI公司DeepSeek的突破性成果引发美国科技界震动,同时也让一批美国AI芯片初创公司看到了新机遇。这些公司认为,DeepSeek证明了更低成本、更高效的AI模型训练是可能的,这将促使AI应用大规模普及,从而为专注于AI推理的芯片公司带来巨大商机。他们对此欢欣鼓舞,纷纷表示这是挑战英伟达主导地位的良机。