芯片架构 关键字列表
Mythic收购Videantis,打造全球最节能AI计算平台

Mythic收购Videantis,打造全球最节能AI计算平台

Mythic宣布收购欧洲领先数字处理器IP公司Videantis,将模拟存内计算技术与Videantis统一数字处理器架构深度整合,构建能效比传统GPU高出100倍的混合AI计算平台。此次收购延续了Mythic与本田联合开发下一代汽车AI芯片的合作势头,并依托1.25亿美元融资基础,覆盖数据中心、汽车、机器人及国防市场,形成横跨硅谷与德国的跨大西洋AI半导体平台。

Arm公司股价下跌,但其AI服务器CPU需求强劲

Arm公司股价下跌,但其AI服务器CPU需求强劲

Arm Holdings公布第四季度财报,每股收益60美分超出预期,营收14.9亿美元同比增长20%。公司首款自研CPU"Arm AGI CPU"已获超20亿美元客户订单,该芯片与Meta联合开发,专为智能体AI设计,性能是英特尔x86的两倍以上。尽管业绩全面超预期,盘后股价仍下跌逾6%。分析师预测,到2030年数据中心CPU市场规模将达1700亿美元,Arm有望占据最大份额。

2026年半导体行业六大关键趋势深度解析

2026年半导体行业六大关键趋势深度解析

AI芯片仅占全球芯片产量的0.2%,却贡献了约50%的行业总收入。根据HTEC对250位半导体高管的全球调查,仅44%的企业已在多个业务环节全面落地AI,其余56%仍处于试点或探索阶段。2026年,半导体行业的核心竞争将从硬件转向软件生态,边缘AI、芯片小模块化架构、推理效率优化及能源约束管理将成为塑造行业格局的关键趋势。

谷歌将TPU产品线一分为二,迎接智能体时代

谷歌将TPU产品线一分为二,迎接智能体时代

在Google Cloud Next大会上,谷歌发布了第八代TPU的两款独立芯片:专为训练设计的TPU 8t与专为推理优化的TPU 8i。TPU 8t支持百万级芯片互联训练集群,性价比较上代提升2.7倍;TPU 8i引入全新Boardfly网络拓扑与片上集体加速引擎,将全局同步延迟降低5倍,推理性价比提升80%。谷歌认为,智能体工作负载已使单一加速器难以兼顾两种场景,此次拆分是应对新时代的战略选择。

推理计算给AI芯片初创企业带来新的突围机会

推理计算给AI芯片初创企业带来新的突围机会

随着AI应用重心从模型训练转向推理部署,芯片初创企业迎来新的市场机会。推理工作负载多样化,使不同架构各有用武之地。英伟达收购Groq、AWS推出混合计算平台、英特尔发布参考设计,均采用不同芯片分别处理预填充与解码任务。光学推理芯片初创公司Lumai也披露了其混合光电架构方案,目标是以极低功耗实现超高AI性能。与此同时,Tenstorrent则坚持通用架构路线,对碎片化推理方案持保留态度。

下一代芯片将如何重塑数据中心的未来

下一代芯片将如何重塑数据中心的未来

数据中心长期依赖x86架构芯片,但这一格局正面临挑战。AI专用芯片、低功耗设计、耐高温芯片、先进封装技术及卸载芯片等新方向,有望提升能效、降低冷却需求并强化安全性。然而,软件生态的迁移成本与x86的强大惯性,仍是新架构普及的主要障碍。AI工作负载与功耗压力的双重驱动,或将成为推动芯片创新落地数据中心的关键力量。

谷歌押注工作负载专用TPU,同步发布8t与8i两款芯片

谷歌押注工作负载专用TPU,同步发布8t与8i两款芯片

谷歌周二发布两款第八代TPU芯片——面向训练的TPU 8t与面向推理的TPU 8i,重启分体式芯片策略。TPU 8t较前代Ironwood算力提升近3倍,双向带宽达19.2 Tbps;TPU 8i则配备288GB高带宽内存,推理延迟显著降低。分析师指出,此举有助于企业针对不同AI生命周期阶段选用最优价性比方案,避免为推理负载支付训练级成本。两款芯片将于今年晚些时候正式上线。

谷歌发布两款专为"智能体时代"打造的新一代TPU

谷歌发布两款专为"智能体时代"打造的新一代TPU

谷歌推出第八代TPU芯片,分为专注训练的TPU 8t和专注推理的TPU 8i两款。TPU 8t支持最多百万芯片组成单一逻辑集群,每个Pod算力达121 FP4 EFlops,是上代Ironwood的近三倍;TPU 8i则通过扩大片上SRAM至384MB,提升多智能体并发推理效率。两款芯片均采用谷歌自研Axion ARM处理器,能效较上代提升一倍,并支持JAX、PyTorch等主流开发框架。

谷歌推出两款全新TPU芯片,驱动AI训练与推理新浪潮

谷歌推出两款全新TPU芯片,驱动AI训练与推理新浪潮

谷歌在Google Cloud Next 2026大会上发布两款全新定制AI芯片:专为大规模预训练优化的TPU 8t,以及专注高并发推理的TPU 8i。TPU 8t采用3D环形网络拓扑,支持9600芯片互联,性价比较上代提升2.7倍;TPU 8i则搭载三倍SRAM与自研Boardfly ICI网络拓扑,全对全通信跳数降低50%,性价比提升约80%。两款芯片每瓦性能均较上代翻倍。

谷歌推出TPU 8双芯片路线,训练与推理分别优化

谷歌推出TPU 8双芯片路线,训练与推理分别优化

谷歌在年度Cloud Next大会上发布了两款自研AI加速芯片:专为模型训练优化的TPU 8t与专为推理优化的TPU 8i。TPU 8t训练速度较上代提升2.8倍,可通过光路交换机连接多达9600块芯片;TPU 8i则以更大SRAM缓存换取更低推理延迟,并引入集合加速引擎,将集合通信延迟降低五倍。两款芯片均将于今年晚些时候在谷歌云平台正式上线。

英特尔与谷歌签署多年期数据中心芯片合作协议

英特尔与谷歌签署多年期数据中心芯片合作协议

英特尔与谷歌宣布达成多年合作,谷歌将在其云平台部署英特尔多代Xeon处理器,用于支持AI模型推理及通用计算负载。谷歌云已在C4实例中使用Xeon 6 Granite Rapids处理器,该芯片搭载AMX扩展指令集,可加速AI推理中的乘累加运算。双方合作还延伸至英特尔IPU产品线,并将共同开发定制ASIC架构的IPU,专为谷歌云数据中心优化。此次合作对面临服务器CPU市场竞争压力的英特尔而言意义重大。

IBM与Arm合作为大型机提供双架构灵活性

IBM与Arm合作为大型机提供双架构灵活性

IBM开始与芯片制造商Arm合作开发双架构硬件,旨在为企业人工智能和数据密集型工作负载提供更大灵活性。两家公司计划将IBM在Z系列大型机系统中的可靠性、安全性和可扩展性经验,与Arm在节能架构和广泛软件生态系统方面的专业知识相结合,构建面向未来的灵活可扩展计算平台。合作重点是为Arm平台提供企业级可靠性,并探索虚拟化技术扩展,使基于Arm的软件环境能够在IBM企业计算平台内运行。

英伟达发布Vera Rubin平台掀起AI基础设施新一轮竞争浪潮

英伟达发布Vera Rubin平台掀起AI基础设施新一轮竞争浪潮

英伟达在GTC 2026上发布新一代Vera Rubin平台,包含七款全新芯片,旨在支持"代理AI"时代的企业转型。该平台以Rubin GPU和Vera CPU为核心,集成NVLink 6交换机等组件,承诺在AI计算性能上实现"代际飞跃"。新平台不仅提升性能,还解决了AI基础设施的功耗和散热问题,预计下半年通过云服务商和硬件制造商出货。

英特尔投资SambaNova3.5亿美元挑战GPU在AI推理领域的主导地位

英特尔投资SambaNova3.5亿美元挑战GPU在AI推理领域的主导地位

AI基础设施公司SambaNova获得3.5亿美元融资,用于推进其数据流架构技术,作为基于GPU的AI系统的替代方案。英特尔资本参与投资,并将与SambaNova开展多年合作,为客户在生成式AI部署中提供GPU之外的选择。SambaNova预计今年晚些时候推出SN50加速器,性能相比前代产品大幅提升。该公司的三层内存架构能在毫秒级时间内快速切换模型,提高推理效率。

苹果M5 Pro和M5 Max芯片架构升级预测

苹果M5 Pro和M5 Max芯片架构升级预测

据传苹果即将推出的M5 Pro和M5 Max处理器将采用全新架构设计,有别于标准M5芯片。预计将使用台积电SoIC-MH封装技术,将GPU独立为单独芯片模块,实现CPU和GPU性能的独立扩展。这种架构变革将提升芯片可扩展性,降低发热量,可能延长电池续航。新架构有望让苹果在固定芯片面积限制下集成更多GPU核心,特别适合AI和图形处理需求的快速增长,预计将在新一代MacBook Pro中首发。

英伟达Rubin平台发布,大幅降低AI训练和推理成本

英伟达Rubin平台发布,大幅降低AI训练和推理成本

英伟达在CES 2026上发布Rubin计算架构平台,采用六芯片设计支持构建和部署先进AI系统。相比前代Blackwell平台,Rubin能提供更低成本的推理结果并减少模型训练所需GPU数量。微软、AWS、谷歌等科技巨头预计将采用该平台应对算力短缺问题。平台将数据中心而非单个GPU服务器作为计算单元,旨在高效、安全地大规模生产智能。AMD同时推出Helios平台竞争万亿参数训练市场。

SC25超级计算大会:AMD、英伟达、戴尔发布下一代超算产品

SC25超级计算大会:AMD、英伟达、戴尔发布下一代超算产品

本周在圣路易斯举办的SC25超级计算大会上,多家科技巨头发布了面向AI热潮的高性能计算产品。英伟达推出Apollo物理仿真AI模型和两套基于Grace-Blackwell架构的RIKEN超级计算机。戴尔发布AMD Instinct驱动的XE9785服务器和英特尔R770AP服务器,以及两款新交换机。法国与AMD合作建设首台百亿亿次超级计算机Alice Recoque,预算6.4亿美元,将成为欧洲第二台百亿亿次系统。

异构CPU时代来临:多架构协同成为计算新趋势

异构CPU时代来临:多架构协同成为计算新趋势

CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。

AMD推出Helios架构挑战英伟达AI基础设施市场

AMD推出Helios架构挑战英伟达AI基础设施市场

AMD计划在2026年推出Helios机架级架构,直接挑战英伟达在AI基础设施市场的地位。该系统将整合AMD的MI400系列GPU、第六代Epyc Venice CPU和Pensando网卡,设计为将整个机架的加速器作为单一大型GPU运行。CEO苏姿丰表示,客户对这一解决方案兴趣浓厚,ZT Systems团队在开发中发挥关键作用。AMD第三季度营收增长36%至92亿美元。

Google大规模迁移内部工作负载至Arm架构,借助生成式AI工具

Google大规模迁移内部工作负载至Arm架构,借助生成式AI工具

谷歌宣布已将约3万个生产软件包移植到Arm架构,计划全面转换以便在自研Axion芯片和x86处理器上运行工作负载。YouTube、Gmail和BigQuery等服务已在x86和Axion Arm CPU上运行。谷歌开发了名为CogniPort的AI工具协助迁移,成功率约30%。公司声称Axion服务器相比x86实例具有65%的性价比优势和60%的能效提升。