谷歌推出实验性开源模型DiffusionGemma,基于Gemma 4家族构建,采用扩散技术替代传统逐词元处理方式,可同时生成整段文本,推理速度比自回归模型快4倍。该模型为26B混合专家架构,推理时仅激活3.8B参数,量化后可在18GB显存的消费级GPU上运行。它支持双向注意力机制,尤其适用于代码补全、数学推理及实时编辑等非线性任务场景,并以Apache 2.0协议开源发布。
Liquid AI发布了新一代视觉语言基础模型LFM2-VL,专为智能手机、笔记本电脑和嵌入式系统等设备高效部署而设计。该模型基于独特的LIV系统架构,GPU推理速度比同类模型快2倍,同时保持竞争性能。提供450M和1.6B两个版本,支持512×512原生分辨率图像处理,采用模块化架构结合语言模型和视觉编码器。模型已在Hugging Face平台开源发布。