谷歌发布TurboQuant AI数据压缩技术,通过优化键值缓存存储,将推理内存消耗减少至少6倍。该技术结合极坐标量化和约翰逊-林登施特劳斯量化方法,可将KV缓存压缩至2.5位精度,同时保持模型质量。虽然能提升AI推理集群效率,但分析师认为随着长上下文应用需求增长,该技术不会降低对DRAM和NAND存储器的整体需求。
随着AI成本因内存等计算组件价格飙升而急剧上涨,谷歌推出TurboQuant技术创新方案。该技术通过量化压缩大幅减少AI模型的内存使用量,特别是针对占用大量内存的键值缓存进行实时压缩,在保持精度的同时将内存需求降低6倍。虽然TurboQuant可能降低单个AI实例的成本,但专家认为根据杰文斯悖论,效率提升往往导致整体资源使用增加,因此可能不会减缓AI投资增长。
PDF协会计划今年夏季发布Brotli压缩技术规范,这一新技术可将PDF文件大小平均减少10%至25%。然而,企业需要更新包括Adobe Acrobat在内的PDF处理软件以支持新格式,否则将无法打开使用Brotli压缩的PDF文件。这是PDF格式首次出现可能导致兼容性问题的更新,企业需要及时升级相关应用和库依赖。
面对SSD和HDD供应严重短缺,存储公司VAST Data启动"闪存回收"计划,旨在重新利用客户现有SSD存储,通过其更高的数据压缩比技术,让客户在更少的闪存中存储更多数据。该公司称其数据压缩比平均达到3.4:1,纠错码技术比传统RAID系统效率高70%,能为客户提供2-3倍的存储容量。该计划直接瞄准竞争对手的全闪存阵列客户群,承诺以2025年价格水平提供服务,比当前市场价格低50%。
为了减轻基础设施带来的压力,微软开发了一种用于压缩数据的尖端系统。今天上午,微软在一个名为Zipline的开源项目下发布了该系统的规范。