在伦敦Unscripted大会上,DevOps公司Harness展示了最新AI驱动模块,包括AI管道构建器、AI测试自动化、构建失败时的自主代码修复、AI应用安全和AI混沌测试等。该公司指出,软件团队仅有30-40%时间用于规划编码,其余时间消耗在测试、安全、部署和优化上。CEO表示,通过专用AI智能体分解任务并相互验证输出,结合组织上下文知识,可有效减少AI幻觉问题。
2025年,人工智能进入智能体时代,AI不再只是分析数据或生成文本,而是能够代表用户执行实际操作。AI智能体可以预订旅行、管理预算、处理保险理赔等,但这种自主性也带来了巨大风险。与传统软件不同,智能体在动态环境中运作,行为难以预测。目前的测试方法无法应对复杂的现实场景,急需新的验证层来持续监控和验证智能体行为,确保其安全可靠地运行。