英国北部一家公司运行着8CPU的Sun服务器,支撑Oracle数据库销售平台。尽管有昂贵的专线监控和一小时内响应的外包支持合同,但监控系统只能检测启动而非宕机。每当CPU卡故障导致服务器重启失败时,内部IT团队总是抢在外包工程师到达前完成修复。由于地理位置和恶劣天气影响,外包支持往往无法及时到达。最终公司告知外包商无需冒险赶路,供应商也免除了两年专线费用。
云架构的复杂性使IT故障成本高昂,平均每分钟停机损失超过1.4万美元。IBM研究院推出ALICE项目,这是一个多智能体系统,能自动化IT挑战。ALICE通过事件分析、代码上下文和代码分析等智能体协同工作,系统性排查问题并生成详细报告。早期测试显示,在识别问题根本原因方面改善了10%-25%。