高效推理文章列表第1页-至顶网频道

高效推理关键字列表

人工智能

扩散模型

高效推理

2026-06-19

DiffusionGemma：谷歌发布突破左右序列处理限制的新 AI 模型

谷歌推出实验性开源模型DiffusionGemma，基于Gemma 4家族构建，采用扩散技术替代传统逐词元处理方式，可同时生成整段文本，推理速度比自回归模型快4倍。该模型为26B混合专家架构，推理时仅激活3.8B参数，量化后可在18GB显存的消费级GPU上运行。它支持双向注意力机制，尤其适用于代码补全、数学推理及实时编辑等非线性任务场景，并以Apache 2.0协议开源发布。

人工智能

多模态处理

高效推理

2025-08-13

Liquid AI推出LFM2-VL模型，让智能手机拥有快速视觉AI能力

Liquid AI发布了新一代视觉语言基础模型LFM2-VL，专为智能手机、笔记本电脑和嵌入式系统等设备高效部署而设计。该模型基于独特的LIV系统架构，GPU推理速度比同类模型快2倍，同时保持竞争性能。提供450M和1.6B两个版本，支持512×512原生分辨率图像处理，采用模块化架构结合语言模型和视觉编码器。模型已在Hugging Face平台开源发布。

白皮书

数字化转型方略

人工智能

扩散模型

高效推理

DiffusionGemma：谷歌发布突破左右序列处理限制的新 AI 模型

人工智能

多模态处理

高效推理

Liquid AI推出LFM2-VL模型，让智能手机拥有快速视觉AI能力

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: