随着AI热潮推动数据中心建设,内存价格飙升,开发者需要重新审视软件的内存消耗问题。现代简单网页需要数兆字节显示基本内容,Windows任务管理器从85KB膨胀到6MB,这种软件臃肿现象日益严重。开发者应精确评估框架需求,注重效率优化,管理者需为此提供空间。正如1970年代能源短缺促进了效率提升,当前的内存短缺或许能推动软件摆脱不必要的冗余,回归精简高效。
Kioxia 发布开源 AiSAQ 技术,旨在降低生成式 AI 系统中的 DRAM 需求。该技术为 SSD 优化的近似最近邻搜索算法,可直接在 SSD 上搜索,无需将索引数据放入 DRAM,从而实现检索增强生成 (RAG) 的可扩展性能。这一创新有望大幅提升大规模 RAG 应用的性能范围。
微软研究人员提出了一种新的内存技术——管理保留内存 (MRM),旨在解决 AI 基础模型工作负载的存储和 IO 问题。MRM 具有短期数据持久性,可优化 AI 推理性能,同时降低能耗和成本。这一创新概念有望填补现有内存-存储层级中的空白,为 AI 时代的内存技术发展开辟新方向。