开源实践联盟通信 2021年 03月10日

2021年AIOps 6大趋势

AIOps日益增长的趋势,代表着未来市场积极的发展信号。最终,AIOps将有能力帮助IT团队完成各类最重要任务与最紧迫的事务,例如与业务效能密切相关的应用程序与数字服务可靠性、稳定性以及正常运行时间。

日益分散、异构且高度动态化的现代IT环境不仅没有降低监控与管理的难度,反而随着云计算、容器与微服务技术的普及给各类组织带来更严苛的运营挑战。面对这一现实难题,IT领导者正转向AIOps,将人工智能应用于IT运营,希望借此破解IT复杂度提升与传统监控工具不足的窘境。

根据MarketsandMarkets Research的估计,目前全球IT从业者正大量采购AIOps工具。到2023年,全球AIOps市场将从2018年的25.5亿美元增长至110.2亿美元,年均复合增长率达34%。而根据《数字企业杂志》(DEJ)2020年5月发布的一项研究,自2018年以来,已经或有意部署AIOps的组织数量增长了83%。"AIOps日益增长的趋势,代表着未来市场积极的发展信号。"Dennis Drogseth, EMA研究副总裁强调。

AIOps确实做出了令人瞩目的承诺,包括在IT问题的检测、诊断与解决方面带来速度与精度的本质性提升,借此显著减少关键应用与数字服务的中断几率。然而,AIOps的采用与部署本身也成为一种新的难题。

下面,我们一起来看IT决策者应在2021年的AIOps战略规划中高度关注的六大趋势。

趋势一 AIOps将带来更多炒作与困扰

与曾在市场上掀起热议的各类技术术语类似,关于AIOps的定义与理解方式同样五花八门、各执一词。根据DEJ的研究,64%的受访者认为AIOps解决方案的发展前景“令人困惑”。EMA的Drogseth对此表示赞同,认为AIOps仍笼罩在一片迷雾当中。

专家们表示,随着AIOps的普及,加之每家供应商都拥有自己的方案形式设计与理解。换言之,IT领导者必须从这场混乱的狂欢中找到真正适合自身需求的AIOps产品。

Micro Focus公司产品经理Gary Brandt表示,在为组织选择正确的AIOps工具时,大家必须投入大量精力做出认真研究与评估。“客户面临的核心挑战,在于分辨出哪些AIOps拥有真正的投资回报与价值、哪些只是跟风炒作。"他说。

Micro Focus公司CTO Lars Rossen则表示,明年AIOps将逐步开始落地,也代表着一部分炒作因素将逐渐幻灭。"有些人误以为AIOps拥有神奇的力量,能够解决他们的所有问题——这显然是不可能的。"

要想对AIOps的具体方法做出正确思考,我们首先得将其理解成过去20年来所建立的IT运营分析技术的延续与扩展。Brandt认为, 无论是监控、事件管理、问题隔离还是自动化,AIOps所改变的是工作「方式」。在这方面,AIOps确实能让企业做得更好。IT领导者还应了解自己采用AIOps的理由与目标。Brandt提到,“大家到底想在混合IT环境中实现哪些改进?请务必明确具体目标。”

Greenlight Group首席顾问Torrey Jones认为,对于正在评估及实施AIOps的组织而言,最重要的是明确供应商一方如何理解AIOps的核心思路。

相对于AIOps,EMA的Drogseth更喜欢使用“高级IT分析”一词,因为这里的指代范围就不再仅仅限于IT运营,同时涵盖DevOps、IT服务管理、安全运营与业务利益相关方。在他看来,AIOps还不算是传统意义上的市场,而更多属于“前景预期”,其中的供应商代表着各种各样的实现方法。而哪种方法更好,无疑取决于组织的实际需求。

EMA在其最近发布的《AIOps:创新投资指南》中涵盖了AIOps产品及服务所应遵循的一系列核心标准,包括:

• 吸纳来自跨域来源的大量数据

• 访问关键数据类型,例如事件、日志与配置数据

• 自学习能力,借此提供预测性、说明性以及可行性洞见

• 支持广泛的高级启发方式

• 可覆盖并整合多种监控工具

• 支持私有及公有云以及混合/传统环境

• 支持多种用例

趋势二 AIOps将为安全工作增添助力

多年以来,AIOps一直展现出增强网络安全的潜力,而2021年很可能成为潜力转化为现实的一年。德勤咨询公司首席云战略官David Linthicum表示,通过弥合IT运营与安全运营之间的鸿沟,AIOps将进一步提升系统的正常运行时间与可靠性。

例如,通过安全数据可见性,AIOps能够判断某些应用程序性能问题并非源自IT故障,而是由针对基础服务器的网络攻击所导致。Linthicum强调,“面对这类特殊情况,我们应该启动安全流程以实施防御。但在传统工具方面,这类状况往往仍被视为正常的性能问题,而很少会与安全威胁联系起来。”

Linthicum还补充道,这种能力将把运营转化为第一道安全防线,确保管理者及时关闭受到攻击的服务器或者已遭入侵的存储系统。

趋势三 工具供应商将掀起合并浪潮

随着AIOps市场的发展,更多厂商涌入其中,淘汰阶段也将随之而来。目前,已经有不少传统监控工具供应商计划在现有产品中添加AIOps功能,而实现方式自然是直接收购某些体量较小的AIOps厂商。Linthicum认为,“这将为客户们带来更好的AIOps技术。”

作为一种概念及技术类别,AIOps代表着运营运维工具的全面成熟。近年来,传统运营与CloudOps领域内的大多数供应商开始“将AI引擎整合至自己的工具当中,而且无论能否实际使用,成果都会被称为AIOps。”

接下来就是初创企业专用的AIOps工具。这类工具在设计之初就考虑到对AI技术的应用。而哪种工具更适用,同样取决于组织的实际需求。

这类初创工具往往更具创新性,能够更有效地使用AI技术,且能够支持云平台等现代系统。相比之下,经历过AIOps的原传统工具比较倾向于支持遗留系统,而且主要服务于那些希望通过单一工具同时管理传统系统与云系统的IT运营人员。

"当然,二者是互补的,很多企业都在使用这两种类型来覆盖一切运营基础设施。"David Linthicum说。

趋势四 DevOps专业人士将广泛接纳AIOps

AIOps主要面向IT运营群体,但其吸引力也开始逐步扩展到DevOps团队,帮助他们通过高级工具监控复杂环境,并据此生成原始、细化且广泛的可观察性数据,包括日志、指标与跟踪等等。

通过将AI与机器学习(ML)算法应用于可观察及监控数据,AIOps将成为DevOps工具链中的一部分,专注于监控并管理测试、性能与安全性等议题。Linthicum认为,这种方法还能够“通过自动化方式向集成工具及DevOps工程师提供实时反馈。”

标普全球市场情报部门451 Research高级分析师Nancy Gohring表示,在该公司近期对DevOps从业者的调查当中,42%的受访者将AIOps定义为使用AI及ML技术分析日志、跟踪与指标的工具。"这与人们定义可观察性的思路保持一致。因此在DevOps从业者中,AIOps往往与可观察性之间存在有趣的交集。"

趋势五 自动化能力将得到扩展

在诞生之初,AIOps产品就一直将自动化视为核心要素,但自动化的具体实现可以借由多种不同形式。虽然AIOps产品目前还没有完全消除人为干预的需求,但预计这方面问题将在2021年得到显著改善。

如今,越来越多的产品开始吸纳与解决用例或工作流相关问题的自动化功能。Micro Focus的Brandt认为,“现在,我们已经意识到如何通过分析触发或推动这一进程。因此,我认为自动化将成为AIOps的一大发展趋势。”

而在Micro Focus的Rossen看来,AIOps在技术本体与企业应用层面有望迎来四项具体自动化升级:

• AIOps自动化的“典型”类别,即大量摄取日志,而后使用ML算法进行分析以检测与基准不符的异常情况。

• 机器人流程自动化,无需人为干预即可触发修复程序。

• 分析与关联拓扑数据,借此查看系统内的连接方式,而后使用此信息发现引发问题的根本原因。

• 自动化,帮助最终用户通过智能虚拟代理(例如自动化服务台)直观解决问题,显著提升客户支持的精度与实用度。

德勤的Linthicum也强调了自主修复能力的进步。他强调,某些AIOps已经可以“解决管理或监控系统所发现的问题。”在AIOps系统发现问题后,即会启动相应进程尝试将其解决,例如重新启动服务器或者网络hub。"目前的主体趋势,正朝着主动或自我修复型AIOps工具的方向迈进。"David Linthicum 总结道。

趋势六 集体智能的应用将不断深化

451 Research的Gohring认为,AIOps当中另一个值得关注的重要趋势在于“集体智能”,即由AIOps供应商汇总来自客户的全部监控数据,借此整理出能够与其他各方共享的总体趋势。Gohring认为,“他们会分析整个客户群体的数据,据此制定出基准并提供相应洞见。”

例如,供应商可以查看来自客户在特定领域中的发展绩效指标,并基于集体知识预测其中存在哪些问题。此外,她认为供应商也可以分析客户对特定问题的解决方法并加以共享,帮助其他客户在应对同类问题时获得宝贵启发。

小结:AIOps将在2021年大放异彩

随着2021年的到来,IT领导者们有必要运用AIOps应对愈发难以监控的复杂环境。

AIOps可能无法满足供应商做出的过高承诺,但事实证明,这项技术在现实世界中确实能够为IT运营带来自动化与精简支持。

此外,从以上几大趋势来看,AIOps技术正在不断发展完善,覆盖范围也开始向DevOps及SecOps等领域扩展。

最终,AIOps将有能力帮助IT团队完成各类最重要任务与最紧迫的事务,例如与业务效能密切相关的应用程序与数字服务可靠性、稳定性以及正常运行时间。

《数字化转型方略》杂志 《数字化转型方略》杂志