张量处理单元 关键字列表
谷歌云发布两款全新AI芯片,与英伟达同台竞技

谷歌云发布两款全新AI芯片,与英伟达同台竞技

谷歌云宣布推出第八代自研AI芯片,分为两款:专注模型训练的TPU 8t和专注推理的TPU 8i。新芯片训练速度提升3倍,每美元性能提高80%,支持超百万个TPU协同工作。尽管如此,谷歌并非要全面取代英伟达,其云平台仍将提供英伟达最新芯片Vera Rubin。同时,谷歌与英伟达合作优化网络技术Falcon,以提升英伟达系统在谷歌云中的运行效率。

谷歌与Meta达成数十亿美元AI芯片租用协议

谷歌与Meta达成数十亿美元AI芯片租用协议

据报道,Meta已同意与谷歌云达成一项数十亿美元的协议,租用其定制AI芯片张量处理单元(TPU)来训练和运行下一代大语言模型。这一合作帮助Meta实现AI硬件供应商多样化,摆脱对英伟达的过度依赖。谷歌最新的Ironwood TPU在性能上大幅领先竞争对手,并希望通过此类合作打破英伟达在AI芯片市场的垄断地位。

Google与英伟达AI芯片竞争升级,Meta寻求合作

Google与英伟达AI芯片竞争升级,Meta寻求合作

据报道,Meta正与谷歌就采购数十亿美元AI芯片进行谈判,这将进一步推动谷歌在AI芯片市场对英伟达的挑战。Meta计划在2027年在其数据中心使用谷歌的张量处理单元TPU,并可能明年租用谷歌云的芯片服务。此前谷歌已与Anthropic达成供应百万芯片的协议,显示其TPU正成为英伟达GPU的有力替代品。

Google推出Ironwood TPU和Axion实例满足AI推理需求激增

Google推出Ironwood TPU和Axion实例满足AI推理需求激增

谷歌宣布为云客户推出定制Ironwood芯片,这款张量处理单元可在单个pod中扩展至9216个芯片,成为该公司迄今最强大的AI加速器架构。新芯片将在未来几周内向客户提供,同时推出基于Arm的新Axion实例,承诺提供比当前x86替代方案高达两倍的性价比。该公司还扩展了Axion产品线,推出N4A第二代虚拟机和C4A金属实例预览版本。

谷歌Ironwood TPU对英伟达构成超预期威胁

谷歌Ironwood TPU对英伟达构成超预期威胁

谷歌最新一代Ironwood TPU v7加速器即将上市,在性能上已接近英伟达Blackwell GPU水平。每颗TPU提供4.6 petaFLOPS的FP8性能,配备192GB HBM3e内存。谷歌真正优势在于规模化能力,TPU pod最多可容纳9216颗芯片,理论上可扩展至40万颗加速器。采用3D环面拓扑和光学电路交换技术,在大规模计算集群方面具有独特优势。

谷歌展示其推理规模和技术实力

谷歌展示其推理规模和技术实力

谷歌在AI基础设施峰会上披露了其AI推理的惊人规模增长。从2024年4月的9.7万亿tokens/月激增至2025年8月的约1460万亿tokens/月,增长49.5倍。公司推出全新Ironwood TPU v7p系统,性能比前代提升5倍,内存容量增加6倍,单集群可容纳9216个TPU。谷歌还展示了液冷技术和推理优化工具,可将推理延迟降低96%,吞吐量提升40%,成本降低30%。

OpenAI与谷歌合作测试TPU芯片但暂无大规模部署计划

OpenAI与谷歌合作测试TPU芯片但暂无大规模部署计划

OpenAI澄清虽在测试谷歌TPU芯片,但暂无大规模部署计划。该公司正摆脱对微软基础设施的依赖,寻求包括甲骨文、CoreWeave等多家算力供应商合作。OpenAI一直在硬件栈多元化方面努力,从英伟达DGX系统起步,现已使用微软Maia加速器、AMD Instinct MI300系列等多种硬件。公司还在开发自研AI芯片。分析认为,OpenAI可能因软件栈主要针对GPU优化,适配TPU架构需要额外时间和资源投入。