推理芯片 关键字列表
AI算力争夺战中,谁会成为下一个Cerebras?

AI算力争夺战中,谁会成为下一个Cerebras?

AI推理算力需求持续爆发,初创公司General Compute完成1500万美元种子轮融资,融后估值6000万美元,由FUSE VC领投。该公司专注AI推理云服务,选择采用Intel支持的SambaNova专用芯片,其新一代芯片推理速度可达600-700 tokens/秒,远超GPU的250 tokens/秒。该芯片支持风冷部署,可降低数据中心基础设施成本,General Compute已订购价值3亿美元的SN50芯片。

英伟达Groq 3推出,AI推理时代或将到来

英伟达Groq 3推出,AI推理时代或将到来

英伟达CEO黄仁勋在GTC大会上发布了全新Vera Rubin芯片系列,其中包括专为AI推理设计的Nvidia Groq 3语言处理单元。该芯片基于英伟达去年以200亿美元收购的Groq公司技术,采用SRAM内存集成设计,实现极低延迟的推理计算。与传统GPU不同,Groq 3优化了数据流处理,内存带宽达150TB/s,是Rubin GPU的7倍,标志着AI从模型训练向大规模应用推理的重要转变。

英伟达研发神秘AI推理芯片,下月或正式发布

英伟达研发神秘AI推理芯片,下月或正式发布

据《华尔街日报》报道,英伟达正在开发一款专用推理处理器,供OpenAI等人工智能公司使用以开发更快更高效的模型。该推理平台预计在本月晚些时候的GTC开发者大会上发布,将整合去年12月从芯片初创公司Groq收购的技术。OpenAI已提前获得该芯片的使用权并将成为首批采用者。英伟达以200亿美元许可了Groq的技术,该技术被称为"语言处理单元",基于全新架构实现更低能耗的推理处理。

AI推理成为下一代芯片竞争新战场

AI推理成为下一代芯片竞争新战场

AI推理已成为行业新的利润中心,主要芯片制造商正竞相优化延迟、功耗和成本,推动从通用GPU向专用硅片的转变。英伟达与Groq的200亿美元授权协议凸显了这一转向。AMD收购了Untether AI的工程团队,英特尔正寻求收购SambaNova。分析师预计,随着企业从试点转向生产,推理需求激增将为专用芯片创造机会,特别是在功耗和成本敏感的环境中。

英伟达授权Groq推理芯片技术并聘用其领导团队

英伟达授权Groq推理芯片技术并聘用其领导团队

英伟达已获得推理芯片设计商Groq的非独家知识产权许可,并聘用了其多名高级管理人员,但未进行完全收购。此次交易价值可能高达200亿美元。Groq专门设计用于AI推理的低功耗、低价格芯片,采用静态RAM技术,与英伟达使用的高带宽内存不同。通过IP许可方式,英伟达可实现内存采购多元化,同时避免承接Groq的云服务业务和反垄断审查。

Counterintuitive推出推理原生计算架构,欲取代GPU

Counterintuitive推出推理原生计算架构,欲取代GPU

人工智能初创公司Counterintuitive Corp.正式发布,旨在通过开发专为推理而非模仿设计的芯片和软件来重新定义AI。该公司提出人工推理单元(ARU)这一全新计算架构类别,以解决现代AI面临的"精度无真理、推理无记忆"双重困境。ARU采用确定性、记忆驱动的推理架构,配合全栈推理软件,承诺突破当前AI局限性,开启后GPU时代的智能计算新纪元。

Positron推出专业AI推理芯片,挑战英伟达市场地位

Positron推出专业AI推理芯片,挑战英伟达市场地位

初创公司Positron获得5160万美元A轮融资,推出专门针对AI推理的Atlas芯片。该公司声称其芯片在性能功耗比和成本效益方面比英伟达H100高出2-5倍,并已获得Cloudflare等企业客户采用。Positron专注于内存优化设计,无需液体冷却,可直接部署在现有数据中心。公司计划2026年推出支持16万亿参数模型的下一代Titan平台。