本地部署文章列表第1页-至顶网频道

2026-05-28

戴尔科技峰会2026：AI的未来在本地部署

戴尔科技世界大会2026聚焦企业AI落地实践，核心趋势指向本地化部署。随着云端大模型调用成本激增，戴尔COO透露AI令牌用量已增长320倍，预计2030年将增长3400%。数据主权需求、智能体治理要求以及对关键系统的直接管控，正推动企业将AI工作负载从云端迁移至本地计算资源。大会发布了Dell AI数据平台及桌面智能体AI开发套件等新品，助力企业构建安全可控的AI基础设施。

人工智能

本地部署

隐私保护

2026-05-27

我放弃ChatGPT，转用免费、私密的本地AI工具Ollama

Ollama是一款可在本地安装的免费开源AI工具，支持Linux、MacOS和Windows系统。用户可直接在本地运行大语言模型，无需付费且完全私密。相比ChatGPT等云端AI服务，Ollama不会收集用户查询数据，能耗更低更环保，支持多种LLM模型切换，可在局域网内共享使用，甚至能在断网环境下运行，为用户提供了更灵活安全的AI使用方式。

人工智能

开放模型

本地部署

2026-04-03

谷歌发布Gemma 4模型，为低功耗设备带来复杂推理能力

谷歌发布最先进开放权重AI模型Gemma 4，基于Gemini 3架构，专为复杂推理任务和本地自主AI代理设计。该系列包含四个版本，从2B到31B参数不等，可在智能手机、工作站等低功耗设备上运行。模型支持原生函数调用、图像视频处理和音频输入，上下文窗口扩展至256K，采用Apache 2.0许可证，可通过谷歌云等平台获取。

人工智能

开源技术

本地部署

2026-04-03

谷歌Gemma 4开源模型正式发布，手机也能运行强大本地AI

谷歌DeepMind发布Gemma 4开源大语言模型，采用Apache 2.0许可证，实现真正开源。该模型包含四个版本：高端服务器用的26B和31B参数版本，以及专为移动设备和物联网设备设计的2B和4B参数轻量版。用户可免费下载并本地运行，无需依赖云服务，特别适合数据主权要求严格的企业和网络连接受限的设备使用。

人工智能

本地部署

模型优化

2026-04-03

NVIDIA加速Gemma 4本地智能体AI：从RTX到Spark全面优化

谷歌发布Gemma 4系列开放模型新成员，包括E2B、E4B、26B和31B变体，专为从边缘设备到高性能GPU的高效部署而设计。NVIDIA与谷歌合作优化该模型，支持从RTX PC到DGX Spark个人AI超级计算机等多种设备。新模型具备推理、编程、智能体、多模态交互等能力，支持35种以上语言。通过Ollama和llama.cpp等工具可实现本地部署。

人工智能

智能体

本地部署

2026-03-13

Perplexity推出"Personal Computer"桌面智能体工具

Perplexity发布名为"Personal Computer"的桌面版AI智能体工具，目前仅限邀请制早期体验。该工具基于Mac Mini运行，可直接访问用户本地文件和应用程序，通过自然语言描述完成复杂任务。系统提供安全防护措施，包括敏感操作需用户批准、完整审计追踪和紧急停止功能。此外，公司还推出企业版云端智能体工具，并开放多个平台的API接口服务。

人工智能

代码生成

本地部署

2026-02-03

本地免费AI代码工具：Goose + Qwen3-coder实测体验

本文介绍了如何搭建完全免费的本地AI编程助手，通过整合Goose开源代理框架、Ollama本地LLM服务器和Qwen3-coder编程模型，实现类似Claude Code的功能。作者详细演示了在Mac上的安装配置过程，并进行了WordPress插件开发测试。尽管需要五次迭代才完成简单任务，但在M4 Max Mac Studio上运行流畅，响应速度与云端方案相当，且数据完全本地化保护隐私。

人工智能

本地部署

性能测试

2026-01-30

我在M1 Mac上测试本地AI的残酷体验

科技记者在配备16GB内存的2021款M1 MacBook Pro上测试Ollama本地AI工具，结果显示运行大语言模型极其困难。测试中的300亿参数GLM-4.7模型响应一个简单问题耗时超过1小时，系统明显变慢。专家建议运行本地AI至少需要32GB内存和更新的处理器。随着云数据中心大量消耗内存资源，DRAM价格飙升，个人用户面临硬件升级压力。

人工智能

视频生成

本地部署

2026-01-23

NVIDIA RTX PC上视觉生成式AI入门指南

AI内容生成技术已融入Adobe和Canva等日常工具，创作者越来越多地在本地PC上运行这些工作流程以保持资产控制权并降低云服务成本。NVIDIA RTX PC凭借高性能优势成为创意AI的首选系统。本文介绍如何使用ComfyUI和流行模型在RTX PC上开始可视化生成式AI创作，包括FLUX.2图像生成和LTX-2视频生成的详细操作步骤和优化技巧。

人工智能

视频生成

本地部署

2026-01-08

Lightricks-2 AI视频模型实现设备端运行突破

Lightricks与英伟达合作推出Lightricks-2 AI视频模型，可在本地设备运行而非依赖云服务。该模型支持生成20秒长、50帧每秒的4K视频片段，并包含原生音频。作为开放权重模型，它为专业创作者提供更安全的选择，保护知识产权。借助英伟达RTX芯片优化，用户可获得高质量结果同时控制数据隐私，缩短生成时间至1-2分钟。

人工智能

本地部署

模型优化

2025-09-01

本地大语言模型崛起：为何用户开始选择自主部署AI

随着AI服务成本上升和数据隐私担忧加剧，越来越多用户开始尝试本地部署大语言模型。硬件性能提升和软件工具优化使得在个人设备上运行AI模型变得可行。通过量化技术降低模型精度要求，配合llama.cpp等开源工具，用户可在消费级硬件上运行各类专业模型。虽然本地模型在通用性上仍逊色于云端大模型，但在特定场景下已能满足需求，且在隐私保护和成本控制方面优势明显。

人工智能

边缘计算

本地部署

2025-06-25

谷歌发布可在机器人本地运行的新Gemini模型

谷歌DeepMind发布了名为Gemini Robotics On-Device的新语言模型，可在机器人上本地运行任务而无需互联网连接。该模型基于3月发布的Gemini Robotics模型构建，能够控制机器人动作，开发者可通过自然语言提示进行控制和调优。谷歌称其性能接近云端版本，在演示中展示了机器人执行拆袋和折衣等任务。

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: