A. 智能运维纲要 概述 优势 大量的数据 具体的业务场景 条件 行业领域知识 算法知识:三个层面 独立模块 需要依赖于其他算法的 系统性问题
运维场景领域知识 工程挑战 没有高质量的标签数据 历史 手工运维 自动化运维 开发运维 智能运维 能力等级 尝试应用 单点应用 串联应用 能力完备
终极AIOps AIOps构建思路 原子场景 相似场景或者相同场景平台化 不同类似场景的串联 更高级场景的串联,真正的AIOps AIOps建模服务能力
数据输入 用户数据 样本库 数据准备 SQL/表达式 代码编辑 分组 关联 分支路由 算法库 特征工程 机器学习 深度学习 时间序列 文本处理 模型构建工具
效果评估 统计分析 数据探索 参数调优 模型选择 计算任务调度管理工具 实时任务 离线任务 API调用任务 交互式任务/交互式引擎 AI模型应用 离线应用
实时应用 API调用应用 常见应用场景 效率提升方向 智能变更 智能问答 智能决策 容量预测 质量保障方向 异常检测 故障诊断 故障预测 故障自愈 报警过滤
成本管理方向 成本优化 资源优化 弹性伸缩 容量规划 性能优化 常见解决方案 数据采集 硬件资源采集 业务数据采集 日志 服务状态 性能跟踪 数据存储
时序数据:时序数据库,例如 OpenTSDB 日志:分布式搜索引擎,例如 ElasticSearch 数据分析 异常检测 日志分析 日志标准化 日志事件提取
指标异常检测 根因分析 模糊逻辑推理 故障预测 模糊逻辑推理 预测算法 关联业务 报表系统 自动化测试平台
热门工具 换一换