AI加速器 关键字列表
企业推理场景需要多样化AI加速器

企业推理场景需要多样化AI加速器

HPC和AI基础设施先驱David Driggers指出,企业推理场景不存在"一刀切"的加速器方案。随着混合专家模型和多模态推理的发展,不同加速器在处理音频、视频、文本等任务时各有优势。企业需根据超低延迟、能效、单token成本等不同需求选择合适平台。他建议将模型部署到能满足需求的最小最简单单元,并在技术栈中尽可能下沉以降低成本。

AMD AI基础设施布局推动数据中心营收同比增长57%

AMD AI基础设施布局推动数据中心营收同比增长57%

AMD发布强劲一季度业绩,总营收达103亿美元,同比增长38%,净利润近乎翻倍至14亿美元。数据中心营收增至58亿美元,同比增长57%,成为公司主要增长引擎。Meta计划部署高达6GW的AMD Instinct GPU,多家云服务商持续扩展EPYC实例。AMD预计二季度营收约112亿美元,同比增长约46%,并将长期服务器CPU市场预期上调至2030年逾1200亿美元。

勃林格殷格翰在伦敦国王十字区建立AI加速中心

勃林格殷格翰在伦敦国王十字区建立AI加速中心

德国制药巨头勃林格殷格翰宣布,将在英国伦敦知识区核心地带设立全新AI与机器学习中心,预计10年内投资1.5亿英镑,并于2027年底前配置首批50名AI专家。该中心将专注于人工智能、机器学习、人类遗传学及计算生物学,助力公司在高未满足医疗需求领域加速疾病研究与新药开发,同时进一步拓展其在英国、欧洲及美国的全球计算创新布局。

韩国Rebellions获得4亿美元融资,推动机架级AI平台全球化

韩国Rebellions获得4亿美元融资,推动机架级AI平台全球化

SK电信支持的AI芯片初创公司Rebellions在IPO前融资轮中筹集4000万美元,用于支持其全球扩张计划。该公司推出新的机架级计算平台RebelRack和RebelPods,面向企业和主权云市场。其Rebel100加速器采用chiplet架构,配备144GB HBM3e内存,单机架可提供64 petaFLOPS的FP8算力。公司已在日本、沙特阿拉伯、台湾和美国开设办事处,计划明年进行IPO。

这些AI工作站看似PC,实则性能更强劲

这些AI工作站看似PC,实则性能更强劲

生成式AI的兴起推动了本地AI工作站的需求,但传统PC难以胜任。Tenstorrent的QuietBox 2配备四个定制Blackhole AI加速器和384GB内存,可运行OpenAI GPT-OSS-120B等大模型,处理速度达每秒500个令牌。该设备功耗仅1400瓦,售价9999美元,计划2026年二季度发布。英伟达DGX Station提供更大内存容量但价格高达85000美元。

微软为美国Azure客户推出全新AI加速器Maia 200

微软为美国Azure客户推出全新AI加速器Maia 200

微软宣布其美国中央数据中心率先部署新型AI推理加速器Maia 200。该产品采用台积电3nm工艺,配备FP8/FP4张量核心和216GB HBM3e高速内存,数据传输速度达7TB/秒。相比竞品,Maia 200的FP4性能是亚马逊Trainium三代的3倍,成本效率提升30%。微软计划在美国西部3区继续部署该技术。

高通如何在数据中心AI推理领域与英伟达竞争

高通如何在数据中心AI推理领域与英伟达竞争

高通凭借在智能手机ARM处理器领域的领先地位,正重新进入服务器市场并扩展AI加速器产品线。与沙特Humain AI公司达成合作协议,开发AI 200和AI 250加速器,预计在能效方面优于英伟达GPU。基于Hexagon架构的AI核心支持标量、向量和张量运算,未来版本将集成Oryon ARM核心。虽然在AI训练领域难以撼动英伟达地位,但在推理市场具备成本和能效优势。

IBM推出自研Spyre加速器并携手Anthropic布局AI市场

IBM推出自研Spyre加速器并携手Anthropic布局AI市场

IBM在techExchange2025开发者大会上宣布与Anthropic建立合作伙伴关系,将Claude模型集成到Watsonx平台。同时发布自研Spyre AI加速器,将于10月28日开始向System z大机出货,12月12日支持Power系统。Spyre支持实时迁移推理工作负载,8卡配置可提供1TB内存和超过2.4千万亿次运算性能。IBM还推出基于多种AI模型的Project Bob集成开发环境,内部测试显示开发效率提升45%。

AMD公司CIO谈AI驱动转型与IT的未来

AMD公司CIO谈AI驱动转型与IT的未来

AMD CIO的职能角色早已超越典型的CIO职务,他积极支持内部产品开发,一切交付其他部门的方案都要先经过他的体验和评判。

分析:Gaudi 3让英特尔可以面向Pytorch群体售卖AI加速器了

分析:Gaudi 3让英特尔可以面向Pytorch群体售卖AI加速器了

近日英特尔在美国菲尼克斯举行的Vision 2024活动上推出了第三代Gaudi AI加速器,英特尔在钱德勒附近拥有大型代工厂,唯一的问题是英特尔可以生产多少个Gaudi 3加速器,价格是多少,什么时候可以发货?

NVIDIA RTX 2000 Ada GPU赋能AI加速的未来,革新各行各业工作流"

NVIDIA RTX 2000 Ada GPU赋能AI加速的未来,革新各行各业工作流"

NVIDIA RTX 2000 Ada的推出为AI加速带来了高性价比的解决方案,展现了NVIDIA在推动技术进步和赋能未来工作方式方面的前瞻性。

Ignite 2023:微软发布首款用于Azure的专有AI加速器和Arm处理器

Ignite 2023:微软发布首款用于Azure的专有AI加速器和Arm处理器

Ignite 2023大会上,微软发布首款定制型AI加速器Azure Maia。

高通凭借富士康Gloria AI Edge Box进军人工智能市场

高通凭借富士康Gloria AI Edge Box进军人工智能市场

结合自身多年来为移动AI应用开发芯片及软件平台解决方案的经验,高通公司自然不会错失这个将AI加速器技术引入其他智能边缘设备乃至云端的好机会。