端侧推理文章列表第1页

LIVE INDEX / 端侧推理

2026-05-29

谷歌发布的Gemma 4模型与Arm计算平台深度协同，推动端侧AI从云端依赖转向本地推理。基于Armv9架构的SME2指令集，Gemma 4在预填充阶段实现平均5.5倍加速，解码速度提升最高1.6倍。通过Arm Klei...

2026-02-03

谷歌基于TensorFlow Lite演进的设备端推理框架LiteRT引入先进加速功能,基于下一代GPU引擎ML Drift。LiteRT的GPU性能比TFLite快1.4倍,提供GPU和NPU跨边缘平台的统一加速工作流...

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026