微软推出突破性推理加速器Maia 200,专为大型推理模型设计。该芯片采用3nm工艺,在4位浮点性能上比亚马逊Trainium3高3倍,8位浮点性能超越谷歌TPU v7。配备216GB高带宽内存,性价比提升30%。芯片具备重新设计的内存子系统和专用网络架构,支持多模态AI能力。将服务于OpenAI GPT-5.2等模型,并集成到Azure平台中。
微软推出Maia 200 AI推理加速器,专为大型推理模型设计。该芯片采用3nm工艺,提供10,145 FP4 TOPS峰值性能,比亚马逊Trainium3高3倍,8位浮点性能超越谷歌TPU v7。配备216GB HBM容量和7TB/s带宽,成本效益比现有硬件提升30%。芯片集成重新设计的内存子系统,支持高带宽数据传输。将服务于OpenAI GPT-5.2等模型,并与Azure、Microsoft 365 Copilot无缝集成。
英伟达在InfraAI全球峰会上发布了Vera Rubin数据中心AI产品系列的新成员Rubin CPX。这款AI GPU推理加速器专为复杂AI任务优化,如百万行软件开发、长时间视频生成等。Rubin CPX配备128GB GDDR7内存,性能达30 petaFLOPs,相比GB300 NVL72在注意力加速方面提升3倍。英伟达计划将其集成到Vera Rubin NVL144 CPX机架中,可实现8 exaFLOPs性能,投资回报率达30-50倍。