AI推理文章列表第1页-至顶网频道

AI推理关键字列表

人工智能

AI推理

新型芯片

2025-10-28

高通进军数据中心AI芯片市场挑战英伟达AMD

高通发布两款全新AI加速器芯片AI200和AI250，正式进军蓬勃发展的数据中心市场，直接挑战GPU巨头英伟达的AI市场主导地位。这家此前专注于移动和无线设备芯片的半导体公司表示，新芯片将通过全新内存架构提供机架级性能，以更低成本实现增强的AI推理能力。AI200将于2026年商用，AI250于2027年推出。

人工智能

AI推理

超低延迟技术

2025-09-09

d-Matrix推出IO加速器，宣称AI推理延迟将达到全新低点

d-Matrix在AI基础设施峰会上发布JetStream IO加速卡，这款定制PCI卡可提供400Gbps带宽和2微秒延迟。该产品基于FPGA技术，可与去年发布的Corsair推理加速平台配合使用，支持在服务器内部和多节点间扩展。CEO表示，随着行业重点从大模型训练转向商业化推理，该产品旨在解决内存计算瓶颈后的IO瓶颈问题。JetStream采用标准以太网协议，可直接部署到现有数据中心。

人工智能

AI推理

融资轮次

2025-09-08

AI推理初创公司Baseten获1.5亿美元融资

AI推理初创公司Baseten完成1.5亿美元D轮融资，估值达21.5亿美元。该轮融资由BOND领投，谷歌母公司Alphabet旗下CapitalG等多家知名机构参投。Baseten提供AI推理加速平台，声称性能比竞品快50%，支持本地部署和云端托管。平台采用拓扑感知并行技术优化硬件使用，通过算子融合和量化工具提升模型性能，并提供完整的开发者工具链和监控功能。

分布式内存

AI推理

超低延迟处理

2025-06-20

GridGain技术助力AI推理，分布式内存架构释放计算潜能

GridGain软件通过集群服务器实现内存共享，使内存密集型应用能在单独内存不足的服务器上运行。该技术在AI推理领域日益重要，因为所需令牌数量不断增长。软件提供跨x86服务器集群的分布式内存空间，具备大规模并行架构。GridGain声称其引擎可用于任何数据驱动的分析或事件处理项目，提供超低延迟的分布式多模型数据存储和计算引擎，实时为AI推理引擎提供企业数据。