缓存优化文章列表第1页-至顶网频道

缓存优化关键字列表

华为将推出AI SSD缓解GPU内存瓶颈问题

华为即将发布AI固态硬盘，配合统一缓存管理软件，将键值缓存数据从GPU高带宽内存中转移到SSD存储，避免重复计算以提升AI处理速度。该方案采用分层缓存架构，整合GPU内存、CPU内存和SSD存储。华为还将运用XtremeLink技术和SpeedFlex印刷电路板技术。此举旨在解决GPU服务器内存墙问题，帮助中国构建新的AI生态系统。

英伟达通过Dynamo引擎实现分层KV缓存，将大语言模型的键值对存储从GPU高带宽内存扩展至CPU内存、直连SSD和网络存储。该技术解决了GPU内存不足时向量数据被驱逐需重新计算的问题，通过多层存储架构提升推理效率。Dynamo支持vLLM等推理引擎，具备分离服务、智能路由等四大功能。目前已有Cloudian、DDN、戴尔、HPE、NetApp、Pure Storage等多家存储厂商宣布支持该技术。

白皮书

数字化转型方略

人工智能

存储技术

缓存优化

华为将推出AI SSD缓解GPU内存瓶颈问题

人工智能

分布式存储

缓存优化

英伟达用分层KV缓存和Dynamo引擎扩展大语言模型内存

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: