推理计算文章列表第1页-至顶网频道

推理计算关键字列表

人工智能

推理计算

加速器技术

2026-03-18

英伟达发布Groq 3 LPX推理加速器，瞄准AI基础设施下一战场

英伟达发布Groq 3 LPX推理加速器，结合Vera Rubin GPU架构，专为万亿参数模型和百万token上下文优化。该技术可实现每兆瓦高达35倍推理吞吐量提升，并带来10倍收入机会。新架构采用分离式推理方式，GPU处理预填充阶段，LPX处理延迟敏感的解码阶段，显著降低延迟。分析师认为这代表了从AI训练向生产推理的范式转变，但企业应评估实际需求和成本效益。

人工智能

推理计算

GPU架构优化

2025-09-15

英伟达展示Rubin CPX推理性能预览

英伟达发布新款Rubin CPX GPU，专为大规模上下文处理而设计，可支持百万级token的软件编程和生成视频。该产品将搭载于Vera Rubin NVL 144 CPX平台，承诺高能效和卓越推理性能，每投资1亿美元可获得50亿美元token收入。同时，英伟达展示了Blackwell Ultra GB300系统的基准测试结果，DeepSeek-R1推理性能较前代提升1.4倍。

人工智能

推理计算

成本优化

2025-02-10

为何这些 AI 芯片初创公司为 DeepSeek 引发的震动欢欣鼓舞

中国AI公司DeepSeek的突破性成果引发美国科技界震动,同时也让一批美国AI芯片初创公司看到了新机遇。这些公司认为,DeepSeek证明了更低成本、更高效的AI模型训练是可能的,这将促使AI应用大规模普及,从而为专注于AI推理的芯片公司带来巨大商机。他们对此欢欣鼓舞,纷纷表示这是挑战英伟达主导地位的良机。

白皮书

数字化转型方略

人工智能

推理计算

加速器技术

英伟达发布Groq 3 LPX推理加速器，瞄准AI基础设施下一战场

人工智能

推理计算

GPU架构优化

英伟达展示Rubin CPX推理性能预览

人工智能

推理计算

成本优化

为何这些 AI 芯片初创公司为 DeepSeek 引发的震动欢欣鼓舞

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: