谷歌云宣布推出第八代自研AI芯片,分为两款:专注模型训练的TPU 8t和专注推理的TPU 8i。新芯片训练速度提升3倍,每美元性能提高80%,支持超百万个TPU协同工作。尽管如此,谷歌并非要全面取代英伟达,其云平台仍将提供英伟达最新芯片Vera Rubin。同时,谷歌与英伟达合作优化网络技术Falcon,以提升英伟达系统在谷歌云中的运行效率。
据报道,Meta已同意与谷歌云达成一项数十亿美元的协议,租用其定制AI芯片张量处理单元(TPU)来训练和运行下一代大语言模型。这一合作帮助Meta实现AI硬件供应商多样化,摆脱对英伟达的过度依赖。谷歌最新的Ironwood TPU在性能上大幅领先竞争对手,并希望通过此类合作打破英伟达在AI芯片市场的垄断地位。
据报道,Meta正与谷歌就采购数十亿美元AI芯片进行谈判,这将进一步推动谷歌在AI芯片市场对英伟达的挑战。Meta计划在2027年在其数据中心使用谷歌的张量处理单元TPU,并可能明年租用谷歌云的芯片服务。此前谷歌已与Anthropic达成供应百万芯片的协议,显示其TPU正成为英伟达GPU的有力替代品。
谷歌宣布为云客户推出定制Ironwood芯片,这款张量处理单元可在单个pod中扩展至9216个芯片,成为该公司迄今最强大的AI加速器架构。新芯片将在未来几周内向客户提供,同时推出基于Arm的新Axion实例,承诺提供比当前x86替代方案高达两倍的性价比。该公司还扩展了Axion产品线,推出N4A第二代虚拟机和C4A金属实例预览版本。
谷歌最新一代Ironwood TPU v7加速器即将上市,在性能上已接近英伟达Blackwell GPU水平。每颗TPU提供4.6 petaFLOPS的FP8性能,配备192GB HBM3e内存。谷歌真正优势在于规模化能力,TPU pod最多可容纳9216颗芯片,理论上可扩展至40万颗加速器。采用3D环面拓扑和光学电路交换技术,在大规模计算集群方面具有独特优势。
谷歌在AI基础设施峰会上披露了其AI推理的惊人规模增长。从2024年4月的9.7万亿tokens/月激增至2025年8月的约1460万亿tokens/月,增长49.5倍。公司推出全新Ironwood TPU v7p系统,性能比前代提升5倍,内存容量增加6倍,单集群可容纳9216个TPU。谷歌还展示了液冷技术和推理优化工具,可将推理延迟降低96%,吞吐量提升40%,成本降低30%。
OpenAI澄清虽在测试谷歌TPU芯片,但暂无大规模部署计划。该公司正摆脱对微软基础设施的依赖,寻求包括甲骨文、CoreWeave等多家算力供应商合作。OpenAI一直在硬件栈多元化方面努力,从英伟达DGX系统起步,现已使用微软Maia加速器、AMD Instinct MI300系列等多种硬件。公司还在开发自研AI芯片。分析认为,OpenAI可能因软件栈主要针对GPU优化,适配TPU架构需要额外时间和资源投入。