芯片优化 关键字列表
微软发布第二代AI推理芯片Maia 200

微软发布第二代AI推理芯片Maia 200

微软推出Maia 200 AI推理加速器,专为大型推理模型设计。该芯片采用3nm工艺,提供10,145 FP4 TOPS峰值性能,比亚马逊Trainium3高3倍,8位浮点性能超越谷歌TPU v7。配备216GB HBM容量和7TB/s带宽,成本效益比现有硬件提升30%。芯片集成重新设计的内存子系统,支持高带宽数据传输。将服务于OpenAI GPT-5.2等模型,并与Azure、Microsoft 365 Copilot无缝集成。

AMD推动开放生态系统挑战Cuda主导地位

AMD推动开放生态系统挑战Cuda主导地位

AMD希望通过开源软件生态系统赢得亚太地区AI开发者的青睐,帮助该地区在全球舞台上竞争而无需依赖专有AI开发工具。AMD采用开源路线推出ROCm平台,与vLLM等开源项目集成以实现更快创新,旨在打破Nvidia Cuda等闭源软件环境的垄断。公司推出"ROCm无处不在"计划,统一开发者体验,支持从笔记本到超级计算机的扩展。AMD的芯片架构在推理工作负载方面具有优势。

Kneron发布新一代AI芯片,让大语言模型脱离云端运行于本地设备

Kneron发布新一代AI芯片,让大语言模型脱离云端运行于本地设备

总部位于圣地亚哥的AI公司耐能发布新一代KL1140芯片,这是首款能在边缘端运行完整变换器网络的神经处理单元。该芯片可将大语言模型从云数据中心转移到便携式本地设备中,四颗芯片组合可实现类似GPU的性能,支持1200亿参数模型运行,功耗降低三分之一至一半,硬件成本减少十倍。