首页>全部课程>AiOps运维开发工程师
AiOps运维开发工程师
东方瑞通资深讲师
AiOps运维开发工程师
AiOps运维开发工程师
报名课程可获赠0.0元助学金,助学金说明 >>
退费说明:报名后未上课、以及仅上课半天的学员可无条件全额退培训费
点击查看详情>>
直播面授
课程图标 课程代码 NX0285

课程描述

本课程全面地介绍了智能运维的技术体系,以及大企业的智能运维实践经验,让学员更清晰的了解运维技术的现状和发展方向,在实践中能够有所借鉴。同时,也能帮助运维工程师在一定程度上了解到机器学习的常见算法模型,以及如何将它们应用到运维工作中。

课程包括4个部分。

◆第1部分是运维发展趋势,关注当前运维的发展现状及面临的技术挑战;

◆第2部分是智能运维基础设施,重点讲述了和智能运维技术相关的基础性技术;

◆第3部分是关于智能运维技术的架构和方法,重点介绍了智能化运维体系建设的流程和方法;

◆第4部分是技术案例应用,首先逐一介绍了流行的智能运维技术应用,之后分享了大数据平台不同业务场景下智能监控系统的技术实践方案。

 

课程大纲

第1部分   智能运维发展趋势

第1章 运维现状

1 运维工程

1.1 认识运维

1.2 主要职责

1.3 运维技术

2 运维发展历程

2.1 人工阶段

2.2 工具和自动化阶段

2.3 平台化阶段

2.4 智能运维阶段

3 运维现状

3.1 故障频发

3.2 系统复杂性

3.3 大数据环境


第2章 智能运维

1 海量数据的存储、分析和处理

2 多维度、多数据源

3 信息过载

4 复杂业务模型下的故障定位


第2部分   智能运维基础技术设施

第1章 时序数据分析框架

1 时序数据库简介

1.1 什么是时序数据库

1.2 时序数据库的特点

1.3 时序数据库对比

2 时序数据库Graphite

2.1 Graphite简介

2.2 Graphite在微博广告监控系统中的应用

3 多维分析利器Druid

3.1 什么是Druid

3.2 Druid架构

3.3 Druid在微博广告监控平台中的应用

4 性能神器ClickHouse

4.1 什么是ClickHouse

4.2 ClickHouse的特性

4.3 ClickHouse的不足

4.4 安装配置ClickHouse

4.5 表引擎

4.6 函数支持

第2章 机器学习框架

1 简介

2 TensorFlow介绍

2.1 什么是TensorFlow

2.2 下载安装

2.3 “Hello TensorFlow”示例

3 TensorFlow进阶

3.1 基础理论

3.2 模型准备

3.3 训练数据

3.4 模型训练

3.5 生成seq2seq句子


第3部分   智能运维技术

第1章 数据聚合与关联技术

1 数据聚合

1.1 聚合运算

1.2 多维度聚合

2 降低维度

2.1 将告警聚合成关联“事件”

2.2 减少误报:告警分类

3 数据关联

4 实时数据关联案例

4.1 设计方案


第2章 数据异常点检测技术

1 概述

2 异常检测方法

2.1 基于统计模型的异常点检测

2.2 基于邻近度的异常点检测

2.3 基于密度的异常点检测

3 独立森林


第3章 故障诊断和分析策略

1 日志标准化

2 全链路追踪

3 SLA的统一

4 传统的故障定位方法

4.1 监控告警型

4.2 日志分析型

5 人工智能在故障定位领域的应用

5.1 基于关联规则的相关性分析

5.2 基于决策树的故障诊断


第4章 趋势预测算法

1 移动平均法

2 指数平滑法

3 ARIMA模型

3.1 简介

3.2 重要概念

3.3 参数解释

3.4 建模步骤

3.5 ARIMA模型案例

4 神经网络模型

4.1 卷积神经网络

4.2 循环神经网络

4.3 长短期记忆网络


第4部分   智能运维技术案例

第1章 智能运维技术应用

1 KPI异常检测

2 日志异常检测

3 日志依赖性挖掘

4 事件预测(磁盘和交换机故障预测)

5 云资源容量管理

6 故障根因分析

 

第2章 日志监控系统

1 Elasticsearch分布式搜索引擎 

1.1 分布式文档存储与读取

1.2 分布式文档检索

1.3 分片管理

1.4 路由策略

1.5 映射

2 可视化工具Kibana

2.1 Management

2.2 Discover

2.3 Visualize

2.4 Dashboard

2.5 Timelion

2.6 Dev Tools

3 ELK搭建实践

3.1 Logstash安装配置

3.2 Elasticsearch集群安装配置

3.3 Kibana安装配置


第3章 云平台智能监控系统 

1 监控指标体系

2 功能设计原则

3 整体架构

4 核心功能分析

4.1 全景监控

4.2 趋势预测

4.3 动态阈值

4.4 服务治理


第4章 大数据平台通用监控系统  

1 整体架构  

2 核心模块  

2.1 数据采集(Logtailer)  

2.2 数据路由(Statsd-proxy)  

2.3 聚合运算(Statsd)  

2.4 数据分发(C-Relay)和数据存储  

2.5 告警模块  

2.6 API设计  

2.7 数据可视化  

3 第三方应用  

3.1 决策支持系统  

3.2 运维自动化  

3.3 成本分析和容量日报  

3.4 机器学习