张量处理单元文章列表第1页-至顶网频道

张量处理单元关键字列表

谷歌云发布两款全新AI芯片，与英伟达同台竞技

谷歌云宣布推出第八代自研AI芯片，分为两款：专注模型训练的TPU 8t和专注推理的TPU 8i。新芯片训练速度提升3倍，每美元性能提高80%，支持超百万个TPU协同工作。尽管如此，谷歌并非要全面取代英伟达，其云平台仍将提供英伟达最新芯片Vera Rubin。同时，谷歌与英伟达合作优化网络技术Falcon，以提升英伟达系统在谷歌云中的运行效率。

谷歌与Meta达成数十亿美元AI芯片租用协议

据报道，Meta已同意与谷歌云达成一项数十亿美元的协议，租用其定制AI芯片张量处理单元（TPU）来训练和运行下一代大语言模型。这一合作帮助Meta实现AI硬件供应商多样化，摆脱对英伟达的过度依赖。谷歌最新的Ironwood TPU在性能上大幅领先竞争对手，并希望通过此类合作打破英伟达在AI芯片市场的垄断地位。

Google与英伟达AI芯片竞争升级，Meta寻求合作

据报道，Meta正与谷歌就采购数十亿美元AI芯片进行谈判，这将进一步推动谷歌在AI芯片市场对英伟达的挑战。Meta计划在2027年在其数据中心使用谷歌的张量处理单元TPU，并可能明年租用谷歌云的芯片服务。此前谷歌已与Anthropic达成供应百万芯片的协议，显示其TPU正成为英伟达GPU的有力替代品。

Google推出Ironwood TPU和Axion实例满足AI推理需求激增

谷歌宣布为云客户推出定制Ironwood芯片，这款张量处理单元可在单个pod中扩展至9216个芯片，成为该公司迄今最强大的AI加速器架构。新芯片将在未来几周内向客户提供，同时推出基于Arm的新Axion实例，承诺提供比当前x86替代方案高达两倍的性价比。该公司还扩展了Axion产品线，推出N4A第二代虚拟机和C4A金属实例预览版本。

谷歌Ironwood TPU对英伟达构成超预期威胁

谷歌最新一代Ironwood TPU v7加速器即将上市，在性能上已接近英伟达Blackwell GPU水平。每颗TPU提供4.6 petaFLOPS的FP8性能，配备192GB HBM3e内存。谷歌真正优势在于规模化能力，TPU pod最多可容纳9216颗芯片，理论上可扩展至40万颗加速器。采用3D环面拓扑和光学电路交换技术，在大规模计算集群方面具有独特优势。

谷歌展示其推理规模和技术实力

谷歌在AI基础设施峰会上披露了其AI推理的惊人规模增长。从2024年4月的9.7万亿tokens/月激增至2025年8月的约1460万亿tokens/月，增长49.5倍。公司推出全新Ironwood TPU v7p系统，性能比前代提升5倍，内存容量增加6倍，单集群可容纳9216个TPU。谷歌还展示了液冷技术和推理优化工具，可将推理延迟降低96%，吞吐量提升40%，成本降低30%。

OpenAI澄清虽在测试谷歌TPU芯片，但暂无大规模部署计划。该公司正摆脱对微软基础设施的依赖，寻求包括甲骨文、CoreWeave等多家算力供应商合作。OpenAI一直在硬件栈多元化方面努力，从英伟达DGX系统起步，现已使用微软Maia加速器、AMD Instinct MI300系列等多种硬件。公司还在开发自研AI芯片。分析认为，OpenAI可能因软件栈主要针对GPU优化，适配TPU架构需要额外时间和资源投入。

白皮书

数字化转型方略

人工智能芯片