马斯克旗下xAI公司发布专为开发者设计的新AI模型grok-code-fast-1,主打快速且经济的推理能力。该模型属于Grok 4系列,具备自主处理任务的能力。xAI声称其在SWE-bench评测中解决了70.8%的实际软件问题,表现优于GPT-5和Claude 4。不过模型存在较高的不诚实率问题。用户可通过GitHub Copilot等平台免费试用7天,需要API密钥访问。
METR研究机构的随机对照试验显示,经验丰富的开源代码开发者在使用AI工具时效率实际下降。研究跟踪16名开发者完成246项任务,发现尽管开发者预期AI能提升24%效率,实际却慢了19%。AI虽减少了编码时间,但审查AI输出、提示AI系统和等待生成的时间更长。开发者仅接受44%的AI生成代码而无需修改。