KangAIOps智能运维管理平台

平台介绍

KangAIOps是针对新一代IT基础架构的一套综合智能运维管理平台,其总体架构是基于数据集成框架采集数据,基于任务执行框架实现自动化执行,通过大数据中心、智能算法中心、执行中心三大中心,围绕运营规划、实施交付、运维保障三大场景,实现容量规划、能耗管理、工具链管理、智能故障管理、资源管理、安全管理、质量管理等多个落地场景。

平台特点

总体架构整合了数据集成框架和任务执行框架。基于数据集成框架采集数据,基于任务执行框架实现自动化执行。

多框架整合

围绕运营规划、实施交付、运维保障三大场景实现多场景化管理。

运营规划大场景将基于大数据分析和人工智能算法及分析模型,制定运营规划相关的各种小场景,如容量规划和数据中心能耗管理等。

运维保障大场景结合大数据和机器学习,实现智能监控、智能分析、智能预测。运维工具高度组件化、模块化、体系化。运维场景覆盖应用、系统、网络、安全、设备各环节各角色,全面提升数据中心整体运维保障能力。

实施交付大场景旨在通过全面统一的规划设计,升级改造各运维场景工具,提升体系化运维能力。使运维人员架构设计、流程管理框架与运维工具相互融合、一体化。进而实现各运维场景技术标准化、流程规范化、管理智能化、业务可视化。可包括开发测试一体化(DevOps),自动化工具链等场景。

多场景管理

集成大数据中心、智能算法中心、执行中心,三大中心协同工作。

大数据中心具备两种可选架构,开源大数据平台架构或异构数据统一存储架构。

智能算法中心基于多种算法或算法组合,建立相应分析模型或推理模型,实现对数据的人工智能分析、数据识别和基于多层知识图谱的推理。

执行中心基于分布式的数据处理和工作流调度实现自动化智能运维,包括任务编排和集中脚本管理。执行中心支持分布式集群选举执行、并发执行和顺序执行;支持数据触发的工作流执行。

多中心协作