本地推理优化 关键字列表
谷歌推出本地 AI 智能体工具,Gemma 4 12B 支持笔记本电脑部署

谷歌推出本地 AI 智能体工具,Gemma 4 12B 支持笔记本电脑部署

谷歌发布新工具,支持开发者在本地设备上运行基于Gemma 4 12B的智能体AI工作流。该工具集结合Google AI Edge技术栈,可在普通笔记本上完成数据处理、网页生成等任务。谷歌同步推出macOS版AI Edge Gallery及本地化语音应用,并升级轻量命令行工具LiteRT-LM。分析师指出,本地AI部署面临硬件限制、安全治理及成本转移等挑战,预计隐私敏感型应用将率先迁移至本地运行。

Ollama集成Apple MLX框架,Mac本地AI模型运行速度大幅提升

Ollama集成Apple MLX框架,Mac本地AI模型运行速度大幅提升

Ollama最新版本正式接入苹果MLX框架,利用Apple Silicon统一内存架构,显著降低推理延迟并提升生成速度,尤其对编程类模型效果明显。此次更新还引入更高效的缓存机制及新量化格式支持。与此同时,Ollama新增对英伟达NVFP4低精度推理格式的支持,可在有限硬件资源下运行更大规模模型。目前MLX模型支持已适配Qwen3.5-35B-A3B,更多模型将陆续跟进。