本文介绍了如何搭建完全免费的本地AI编程助手,通过整合Goose开源代理框架、Ollama本地LLM服务器和Qwen3-coder编程模型,实现类似Claude Code的功能。作者详细演示了在Mac上的安装配置过程,并进行了WordPress插件开发测试。尽管需要五次迭代才完成简单任务,但在M4 Max Mac Studio上运行流畅,响应速度与云端方案相当,且数据完全本地化保护隐私。
OpenAI将其Codex AI编程助手直接集成到JetBrains IDE中,开发者可在编辑器内完成代码规划、编写、测试、审查和部署等全流程工作。该功能从2025.3版本开始支持IntelliJ、PyCharm、WebStorm和Rider等IDE。Codex基于GPT-5.2-Codex模型,可处理大型重构、代码迁移等复杂任务,并具备强化的网络安全能力。开发者可通过JetBrains AI订阅、ChatGPT账户或OpenAI API密钥使用该功能,限时免费体验。
Ai2推出开源AI编码代理系列,解决现有代理封闭昂贵难适配问题。首发产品SERA在SWE-Bench基准测试中解决超55%问题,超越同规模开源模型。SERA提供32B和8B两版本,支持一行代码部署。通过专业化训练,小型模型性能可媲美千亿参数模型,成本仅需400美元,比现有方案便宜百倍。
尽管72%的IT专业人员每天使用AI编码助手,但96%的开发者表示不完全信任AI生成的代码。随着AI编码助手输出质量提升,其代码变得更加冗长,使错误更难发现。开发者审查AI代码所需时间有时甚至超过自己编写代码的时间。AI生成的代码往往缺乏对整体架构的理解,可能产生难以维护的代码库。专家指出,关键在于建立流程和规范,帮助工程师高效使用AI辅助工具。
安全初创公司Tenzai的研究显示,主流AI编程平台在响应常见编程指令时持续生成不安全代码,甚至产生"严重级别"漏洞。测试涵盖Claude Code、OpenAI Codex等五款工具,共发现69个安全漏洞,其中约6个被评为"严重"级别。研究发现AI工具擅长避免通用安全缺陷如SQL注入,但在需要上下文理解的业务逻辑和API授权方面表现不佳。专家建议将安全检测嵌入AI开发环境中。
AI建站及应用开发工具开发商Lovable Labs宣布完成3.3亿美元B轮融资,由谷歌CapitalG和Menlo Ventures联合领投,英伟达、Salesforce、HubSpot等科技巨头跟投。公司估值达66亿美元,年度经常性收入已超2亿美元。该平台可通过聊天界面生成网站和应用代码,提供代码编辑、界面设计、托管基础设施等功能。融资将用于增强协作治理能力,拓展企业级市场。
AI代码编辑器开发商Cursor完成23亿美元D轮融资,估值达293亿美元。Accel和Coatue领投,Google、Nvidia等参与。公司年化收入已突破10亿美元。Cursor基于微软开源VS Code打造,集成大语言模型帮助开发者编写代码和修复漏洞。其自研Composer模型采用专家混合算法,运行速度比同等质量模型快四倍。公司拥有数百万开发者用户,将用新资金推进AI研究。
要成功进行"氛围编程",关键是了解所使用的生成式AI或大语言模型的编程个性。不同AI模型生成的代码风格迥异,有的精准简洁,有的冗长混乱。研究显示,当前主流LLM在代码生成方面各有特点,但普遍存在安全漏洞和工程规范不足等问题。用户需要认识到AI生成的代码往往不完整、包含错误,仍需人工审查和完善。
OpenAI推出新AI模型GPT-5-Codex,能够在无用户协助下完成数小时的编程任务。该模型是GPT-5的改进版本,使用额外编码数据训练。测试显示,GPT-5-Codex可独立工作超过7小时,能自动发现并修复编码错误。在重构基准测试中得分51.3%,比GPT高出17%以上。模型可根据任务难度调整处理时间,简单请求处理速度显著提升。目前已在ChatGPT付费计划中提供。
瑞典AI编程公司Lovable专注帮助无编程经验用户构建应用和网站。仅8个月内,公司年收入突破1亿美元,完成2亿美元A轮融资,估值18亿美元,成为欧洲增长最快的独角兽。CEO Osika表示,公司目标是成为最佳软件产品开发平台,通过整合多种AI模型为用户提供无与伦比的能力。尽管面临Anthropic和OpenAI的竞争威胁,Osika专注于产品优化,强调速度、安全性和用户体验。
AI编程助手初创公司面临严峻挑战。Windsurf等公司因依赖昂贵的大语言模型,导致毛利率严重为负,运营成本超过收费。激烈的市场竞争加剧了这一问题,包括Cursor和GitHub Copilot等竞争对手。改善利润率的直接方法是自建模型,但成本高昂且风险巨大。许多公司寄希望于LLM成本未来会下降,但最新模型费用实际在上涨。这种困境可能影响整个AI编程工具行业。
阿里巴巴通义千问团队发布开源编程模型Qwen3-Coder-480B-A35B-Instruct,专门用于软件开发辅助。该模型采用混合专家架构,拥有4800亿参数,支持25.6万token上下文长度,可在数秒内创建完整功能应用。在SWE-bench基准测试中得分67.0%,表现优于GPT-4和Gemini。模型基于Apache 2.0开源许可,企业可免费使用。AI研究者称其可能是目前最佳编程模型,特别适合企业级代码库理解、自动化代码审查和CI/CD系统集成。
Hugging Face推出开源网页应用开发环境AnyCoder,集成实时预览、多模态输入和一键部署功能。该工具由Kimi K2等AI模型驱动,支持用户通过自然语言描述生成HTML、CSS和JavaScript代码。具备UI图像识别、网页搜索集成、OCR文本提取等功能,可直接部署至Hugging Face Spaces平台,为缺乏编程经验的用户提供快速原型开发解决方案。
AI领域持续快速发展,尤其是DeepSeek及其追随者的推出后,许多人认为企业并不真正需要OpenAI、Meta和Google推广的大型昂贵AI模型,而是专注于更小的模型。然而,对于代码生成、推理和智能体AI而言,大模型仍然必不可少。Cerebras Systems宣布支持大型Qwen3-235B模型,支持131K上下文长度,成本仅为每百万输出令牌0.60美元。该模型擅长深度逻辑推理、高级数学和代码生成,能够同时处理数万行代码。
氛围编程是指让AI完全接管代码生成,程序员不直接检查或调整生成的代码。专家认为,虽然AI在代码生成方面已相当强大,但在系统组件交互和远程思维能力上仍有不足。完全依赖AI而不理解代码运行机制存在风险,特别是在生产环境故障排除时。目前AI可能完成80%的工作,但人工监督仍然必要。
Mistral 与 All Hands AI 合作推出了一款专注编程的 AI 模型 Devstral,通过 Apache 2.0 许可证开放使用,在代码浏览、多文件编辑及自动化测试等任务中表现优异,可在 RTX 4090 或高配 Mac 上运行,定价亲民。
法国 Mistral AI 携手 All Hands AI 推出 Devstral——一款拥有240亿参数的开源语言模型,专为软件工程代理开发设计,能跨文件理解代码、执行多步骤任务,并在 SWE-Bench 测试中表现出色,以 Apache 2.0 许可证开放供开发者与企业灵活使用。
Google 在 Cloud Next 2025 大会上发布了面向企业的 Android Studio Gemini 版本。这一订阅服务旨在帮助企业应用开发者更轻松地在 Android 生态系统中创建工作应用。新版本在保留核心 AI 功能的同时,增强了数据隐私、安全性和可定制性,以满足大型组织和开发团队的需求。该服务强调代码保密、知识产权保护,并提供企业级管理功能。
Google 推出了 Firebase Studio,这是一个基于云的人工智能辅助开发环境。它结合了 Project IDX、GenKit 和 Gemini 等技术,旨在帮助开发者快速原型设计和构建应用程序。然而,一些开发者反馈称,目前该工具的 AI 功能还不够成熟,难以生成高质量的可用代码。这表明 AI 辅助开发工具虽有潜力,但仍无法完全取代专业开发人员的技能和经验。
Google 在云计算大会上宣布,其 AI 编程助手 Gemini Code Assist 新增"智能代理"功能,可执行复杂编程任务。这些代理能根据文档规格创建应用,或进行跨语言代码转换。Code Assist 现已支持 Android Studio 等多种编程环境,旨在提高开发效率,应对竞争日益激烈的 AI 编程助手市场。