做到卓越AIOps智能运维的12步
网友 CSDN

目前许多部署AIOps技术的企业(大约60%)希望在短期内实现两个目标:

  1. 获得整个IT产业中的事件和行为的概要视图;

  2. 对未来可能发生的事件有所了解。

但是,这两个目标通常需要一段时间的准备阶段。在准备过程中,企业要充分学习使用AIOps平台所需的独特技能,并在有限的使用案例中“实践”。

在下文中,Gartner提出了I&O(基础设施与运维)领导者应该鼓励他的IT运营团队遵循的12个步骤,通过AIOps来建立一个企业基础架构和应用程序组合的端到端的、面向未来的视图。 这12个步骤的持续进展现在需要大约两年时间。随着IT运营专业人员数据科学技能的提升,这个过程可能会缩短到一年到18个月。

这12个步骤自然分为四个主要阶段:初创阶段,被动响应阶段,主动阶段和扩张阶段。 

image.png

初创阶段

Gartner发现企业经常会从基于大量数据的项目来开始他们的AIOps工作,希望能够快速地整合出一个系统行为的端到端视图。 然而,大多数IT运营团队没有理解和操作大型数据集所需的技能。因此,在初创阶段,I&O领导应该:

  1. 选择一到三个业务应用程序作为测试用例。

  2. 对运维人员的教育和过往履历进行审查,重点关注用于统计分析和复杂模式识别的知识。

  3. 通过普查与运维和开发过程中的应用有关的工具以及相关的日志文件,API和社交媒体,清点能够产生应用程序信息的现有数据源。 

image.png

被动响应阶段

AIOps平台能够处理两种不同的数据:存储的历史数据和实时显示给观测者的流数据。在学习如何应对复杂庞大的数据量时,Gartner发现从历史数据开始会更容易一些。相反,IT运维团队应该通过使用可视化软件并进行集体性的统计分析来提高分析能力。在这个阶段获得的大部分信息将是回顾性的。因此,在这个阶段, I&O领导应该:

  1. 通过部署通用key-object数据库管理平台(如Hadoop或Cassandra)或存储指标和数字或文本字符串的日志管理平台来构建半结构化的AIOps历史数据库。

  2. 通过使用丰富的自然语言和可视化功能以及Tableaux和Graphite等工具覆盖AIOps历史数据库中包含的数据,从而提供数据的广泛权限访问。

  3. 通过部署统计分析或技术计算软件,与从历史数据库提取的数据结合使用,提供聚类,聚合和展示历史数据趋势的方法。

主动阶段

掌握了历史数据和人工分析后,IT运营团队能够转向流数据和实际AI功能的引入。 值得注意的是,相较于未来事件预测,自动异常检测和根本原因分析能够为企业实现更多价值。在主动阶段的三个步骤之中,I&O领导应该:

  1. 将性能,事件,API和社交媒体数据流式传输到相同的访问、可视化和统计分析软件上,并确保访问,可视化和分析可以同时应用于历史数据和流数据,在此基础上引入实时分析功能。

  2. 通过部署面向关联的机器学习软件并将其应用于历史和流数据源,预测应用程序性能事件和行为。

  3. 通过将因果路径提取系统应用于之前在访问,可视化,分析和自动关联确定软件的帮助下进行发现的模式,从而对应用程序性能问题或行为异常进行根本原因分析。

扩张阶段

AIOps功能为IT运维,其他IT元素(如开发和安全)以及最重要的数字业务的核心任务提供了重要接口。随着业务流程的数字化,业务事件越来越多地与IT系统交叉,并在流入并存储在AIOps平台中的数据中留下它们的痕迹。 因此,在扩张阶段的三个步骤中,I&O领导应该:

  1. 通过从大约20个生产中的关键业务应用程序中提取数据到AIOps平台,扩大AIOps覆盖范围。

  2. 通过在平台及其关联的流程和开发,安全性,配置,更改,问题和事件管理技术和流程之间部署双向链接,将AIOps功能转换为跨IT服务。

  3. 通过在平台及其相关流程和数字业务流程分析技术和流程之间部署双向链接,将AIOps功能转换为跨数字业务服务。


CIO之家 www.ciozj.com 公众号:imciow
关联的文档
也许您喜欢