本地部署 关键字列表
戴尔科技峰会2026:AI的未来在本地部署

戴尔科技峰会2026:AI的未来在本地部署

戴尔科技世界大会2026聚焦企业AI落地实践,核心趋势指向本地化部署。随着云端大模型调用成本激增,戴尔COO透露AI令牌用量已增长320倍,预计2030年将增长3400%。数据主权需求、智能体治理要求以及对关键系统的直接管控,正推动企业将AI工作负载从云端迁移至本地计算资源。大会发布了Dell AI数据平台及桌面智能体AI开发套件等新品,助力企业构建安全可控的AI基础设施。

我放弃ChatGPT,转用免费、私密的本地AI工具Ollama

我放弃ChatGPT,转用免费、私密的本地AI工具Ollama

Ollama是一款可在本地安装的免费开源AI工具,支持Linux、MacOS和Windows系统。用户可直接在本地运行大语言模型,无需付费且完全私密。相比ChatGPT等云端AI服务,Ollama不会收集用户查询数据,能耗更低更环保,支持多种LLM模型切换,可在局域网内共享使用,甚至能在断网环境下运行,为用户提供了更灵活安全的AI使用方式。

谷歌发布Gemma 4模型,为低功耗设备带来复杂推理能力

谷歌发布Gemma 4模型,为低功耗设备带来复杂推理能力

谷歌发布最先进开放权重AI模型Gemma 4,基于Gemini 3架构,专为复杂推理任务和本地自主AI代理设计。该系列包含四个版本,从2B到31B参数不等,可在智能手机、工作站等低功耗设备上运行。模型支持原生函数调用、图像视频处理和音频输入,上下文窗口扩展至256K,采用Apache 2.0许可证,可通过谷歌云等平台获取。

谷歌Gemma 4开源模型正式发布,手机也能运行强大本地AI

谷歌Gemma 4开源模型正式发布,手机也能运行强大本地AI

谷歌DeepMind发布Gemma 4开源大语言模型,采用Apache 2.0许可证,实现真正开源。该模型包含四个版本:高端服务器用的26B和31B参数版本,以及专为移动设备和物联网设备设计的2B和4B参数轻量版。用户可免费下载并本地运行,无需依赖云服务,特别适合数据主权要求严格的企业和网络连接受限的设备使用。

NVIDIA加速Gemma 4本地智能体AI:从RTX到Spark全面优化

NVIDIA加速Gemma 4本地智能体AI:从RTX到Spark全面优化

谷歌发布Gemma 4系列开放模型新成员,包括E2B、E4B、26B和31B变体,专为从边缘设备到高性能GPU的高效部署而设计。NVIDIA与谷歌合作优化该模型,支持从RTX PC到DGX Spark个人AI超级计算机等多种设备。新模型具备推理、编程、智能体、多模态交互等能力,支持35种以上语言。通过Ollama和llama.cpp等工具可实现本地部署。

Perplexity推出"Personal Computer"桌面智能体工具

Perplexity推出"Personal Computer"桌面智能体工具

Perplexity发布名为"Personal Computer"的桌面版AI智能体工具,目前仅限邀请制早期体验。该工具基于Mac Mini运行,可直接访问用户本地文件和应用程序,通过自然语言描述完成复杂任务。系统提供安全防护措施,包括敏感操作需用户批准、完整审计追踪和紧急停止功能。此外,公司还推出企业版云端智能体工具,并开放多个平台的API接口服务。

本地免费AI代码工具:Goose + Qwen3-coder实测体验

本地免费AI代码工具:Goose + Qwen3-coder实测体验

本文介绍了如何搭建完全免费的本地AI编程助手,通过整合Goose开源代理框架、Ollama本地LLM服务器和Qwen3-coder编程模型,实现类似Claude Code的功能。作者详细演示了在Mac上的安装配置过程,并进行了WordPress插件开发测试。尽管需要五次迭代才完成简单任务,但在M4 Max Mac Studio上运行流畅,响应速度与云端方案相当,且数据完全本地化保护隐私。

我在M1 Mac上测试本地AI的残酷体验

我在M1 Mac上测试本地AI的残酷体验

科技记者在配备16GB内存的2021款M1 MacBook Pro上测试Ollama本地AI工具,结果显示运行大语言模型极其困难。测试中的300亿参数GLM-4.7模型响应一个简单问题耗时超过1小时,系统明显变慢。专家建议运行本地AI至少需要32GB内存和更新的处理器。随着云数据中心大量消耗内存资源,DRAM价格飙升,个人用户面临硬件升级压力。

NVIDIA RTX PC上视觉生成式AI入门指南

NVIDIA RTX PC上视觉生成式AI入门指南

AI内容生成技术已融入Adobe和Canva等日常工具,创作者越来越多地在本地PC上运行这些工作流程以保持资产控制权并降低云服务成本。NVIDIA RTX PC凭借高性能优势成为创意AI的首选系统。本文介绍如何使用ComfyUI和流行模型在RTX PC上开始可视化生成式AI创作,包括FLUX.2图像生成和LTX-2视频生成的详细操作步骤和优化技巧。

Lightricks-2 AI视频模型实现设备端运行突破

Lightricks-2 AI视频模型实现设备端运行突破

Lightricks与英伟达合作推出Lightricks-2 AI视频模型,可在本地设备运行而非依赖云服务。该模型支持生成20秒长、50帧每秒的4K视频片段,并包含原生音频。作为开放权重模型,它为专业创作者提供更安全的选择,保护知识产权。借助英伟达RTX芯片优化,用户可获得高质量结果同时控制数据隐私,缩短生成时间至1-2分钟。

本地大语言模型崛起:为何用户开始选择自主部署AI

本地大语言模型崛起:为何用户开始选择自主部署AI

随着AI服务成本上升和数据隐私担忧加剧,越来越多用户开始尝试本地部署大语言模型。硬件性能提升和软件工具优化使得在个人设备上运行AI模型变得可行。通过量化技术降低模型精度要求,配合llama.cpp等开源工具,用户可在消费级硬件上运行各类专业模型。虽然本地模型在通用性上仍逊色于云端大模型,但在特定场景下已能满足需求,且在隐私保护和成本控制方面优势明显。

谷歌发布可在机器人本地运行的新Gemini模型

谷歌发布可在机器人本地运行的新Gemini模型

谷歌DeepMind发布了名为Gemini Robotics On-Device的新语言模型,可在机器人上本地运行任务而无需互联网连接。该模型基于3月发布的Gemini Robotics模型构建,能够控制机器人动作,开发者可通过自然语言提示进行控制和调优。谷歌称其性能接近云端版本,在演示中展示了机器人执行拆袋和折衣等任务。