高效推理 关键字列表
DiffusionGemma:谷歌发布突破左右序列处理限制的新 AI 模型

DiffusionGemma:谷歌发布突破左右序列处理限制的新 AI 模型

谷歌推出实验性开源模型DiffusionGemma,基于Gemma 4家族构建,采用扩散技术替代传统逐词元处理方式,可同时生成整段文本,推理速度比自回归模型快4倍。该模型为26B混合专家架构,推理时仅激活3.8B参数,量化后可在18GB显存的消费级GPU上运行。它支持双向注意力机制,尤其适用于代码补全、数学推理及实时编辑等非线性任务场景,并以Apache 2.0协议开源发布。

Liquid AI推出LFM2-VL模型,让智能手机拥有快速视觉AI能力

Liquid AI推出LFM2-VL模型,让智能手机拥有快速视觉AI能力

Liquid AI发布了新一代视觉语言基础模型LFM2-VL,专为智能手机、笔记本电脑和嵌入式系统等设备高效部署而设计。该模型基于独特的LIV系统架构,GPU推理速度比同类模型快2倍,同时保持竞争性能。提供450M和1.6B两个版本,支持512×512原生分辨率图像处理,采用模块化架构结合语言模型和视觉编码器。模型已在Hugging Face平台开源发布。