开源开发者Geoff Huntley创建了一个名为"Ralph"的脚本,使用AI代理和编程助手以极低成本创造高质量软件。该脚本通过bash循环将AI输出反馈给自身,直到获得正确答案。Huntley已用此方法克隆了Atlassian产品和税务应用,每小时仅消耗约10美元的计算资源,远低于开发人员薪酬。Y Combinator众多初创公司已开始使用Ralph技术,Anthropic甚至为此创建了插件。
作者作为编程新手尝试使用AI编码工具开发应用程序。测试了Cursor、Replit、Visual Studio和Lovable等工具,发现它们能自动执行环境搭建、库安装等任务,但也遇到聊天记录丢失、频繁需要命令行操作、云端工具快速消耗配额等问题。最终通过Lovable创建了基本的文本分析应用,但认识到仍需要实际编程技能才能深入开发,AI工具无法完全替代程序员的工作。
OpenAI推出新AI模型GPT-5-Codex,能够在无用户协助下完成数小时的编程任务。该模型是GPT-5的改进版本,使用额外编码数据训练。测试显示,GPT-5-Codex可独立工作超过7小时,能自动发现并修复编码错误。在重构基准测试中得分51.3%,比GPT高出17%以上。模型可根据任务难度调整处理时间,简单请求处理速度显著提升。目前已在ChatGPT付费计划中提供。
谷歌在伦敦云峰会上发布Firebase Studio更新,新增Gemini命令行界面集成、模型上下文协议支持和"代理模式"。代理模式提供三种AI协作层次:对话式"询问"模式用于头脑风暴,人机协作代理需开发者确认代码变更,以及几乎完全自主的代理模式。尽管谷歌声称已有数百万应用使用该平台,但目前仍需精心设计提示词,非工程师用户还无法直接创建成熟应用。
AI编程编辑器Cursor背后的公司Anysphere推出网页应用,用户可通过浏览器管理AI编程代理网络。该应用支持桌面和移动端,用户可用自然语言分配编程任务、监控代理工作进度并合并代码更改。Cursor年经常性收入已超5亿美元,被超半数财富500强企业使用。新应用面向Pro计划及更高级别订阅用户开放,旨在降低使用门槛。公司预计到2026年AI编程代理将承担软件工程师至少20%的工作。
Canva 现要求开发岗位候选人在面试中使用 AI 编码助手,如 Copilot、Cursor 和 Claude,以便更真实评估实际工作表现,同时考察其利用 AI 提升生产力的能力。