首页>全部课程>华为大数据-HCIE-Big Data大数据专家认证 V2.0
华为大数据-HCIE-Big Data大数据专家认证 V2.0
东方瑞通资深讲师
华为大数据-HCIE-Big Data大数据专家认证 V2.0
报名课程可获赠300.0元助学金,助学金说明 >>
退费说明:报名后未上课、以及仅上课半天的学员可无条件全额退培训费
点击查看详情>>
直播面授
时间图标 培训课时 84 课时,14天
标题图标 课程介绍 标题图标

华为大数据专家(HCIE-Big Data)证定位华为大数据分析领域中大型分布式并行处理数据仓库平台的架构原理、优化设计、应用开发和大数据挖掘领域的基础理论、常用挖掘算法、应用设计以及开发、旨在推动业界大数据行业的专家型人才培养。主要内容包括华为企业级的大型并行处理分布式数据仓库平台FusionInsight LibrA的架构、功能特性、数据库设计开发;数据挖掘理论以及使用华为企业级大数据挖掘平台FusionInsight Miner和基于华为云的企业智能平台EI的基础服务- MLS机器学习服务进行数据深度分析和挖掘、通过华为HCIE-Big Data的学习、您将对大数据技术有更加深入的理解、具备运用大数据技术进行大数据分析应用、大数据挖掘应用的专家能力。

标题图标 学员基础 标题图标

学员应了解大数据技术原理和Hadoop的基础知识,具备华为大数据HCNA水平,熟悉Linux的管理和操作、具有数据库的基本知识,有数据库的使用经验,了解 SQL 语言。具备一定软件开发能力,熟悉Java、Python, C++等至少一种开发语言。

标题图标 课程目标 标题图标

理解并掌握大型并行处理数据仓库平台的架构原理、分布式关系型数据库的设计和优化及应用开发;掌握大数据挖掘的基本原理,常用算法、常用挖掘方法、对华为大数据挖掘解决方案FusionInsight Miner和华为云机器学习服务MLS的熟练使用,胜任数据仓库开发、大数据分析、大数据数据挖掘和人工智能的相关岗位。

标题图标 课程大纲 标题图标

章节

教学重点

第1天 上午

人工智能和数据挖掘

  1. AI的社会认知
  2. 人工智能技术的发展史
  3. 人工智能技术的应用方向与应用场景
  4. 人工智能的发展战略
  5. 人工智能现有的问题
  6. 人工智能的未来
  7. 数据挖掘概述和流程
  8. 数据,属性和度量
  9. 数据挖掘开发工具
  10. 数据挖掘学习路径

第1天 下午

Python编程基础

  1. Python编程语言介绍及发展历程
  2. Python语言的应用场景
  3. Python开发环境搭建
  4. 变量
  5. 数据结构(列表,元组,字典,字符串)
  6. 分支语句,循环语句
  7. 函数

第2天 Python编程应用

  1. 面向对象
  2. 异常
  3. 文件处理
  4. 常见三方库
  5. 正则表达式
  6. 数据库
  7. 网络爬虫

第3天 数据分析库

  1. Numpy科学计算库
  2. ndarray的创建、访问、常用属性
  3. 矩阵的创建
  4. 通用函数ufunc
  5. 广播机制
  6. Pandas数据预处理库
  7. Series常用操作
  8. DataFrame常用操作
  9. 读写不同数据源
  10. 数据过滤与转换
  11. 时间序列操作
  12. 分组与聚合
  13. 透视与交叉表
  14. Matplotlib数据可视化

第4天 网络爬虫

  1. 初识爬虫:什么是爬虫、爬虫的工作流程
  2. 获取内容:urllib、urllib3、requests等库的使用
  3. HTML解析:正则表达式、beautifulsoup4
  4. 数据保存:保存为文件、保存进数据库
  5. selenium 框架

第5天 数学知识

  1. 矩阵和线性代数
  2. 行列式
  3. 矩阵及其变换
  4. 矩阵分解
  5. 奇异值分解
  6. 特征值分解
  7. 线性变换
  8. 向量空间
  9. 概率论和数理统计
  10. 随机事件及其概率
  11. 随机变量及其分布
  12. 随机向量及其分布
  13. 随机变量的函数
  14. 随机变量的数字特征
  15. 大数定律与中心极限定理
  16. 样本与抽样分布
  17. 参数估计
  18. 假设检验
  19. 方差分析和回归分析
  20. 信息熵与基尼系数
  21. 最优化
  22. 无约束最优化问题
  23. 梯度下降法
  24. 约束最优化问题
  25. 拉格朗日乘子法

第6天  数据预处理

  1. 数据抽取
  2. 转换和加载
  3. 数据抽取、转换和加载概述
  4. 数据抽取
  5. 数据转换
  6. 数据加载
  7. ETL ELT 介绍
  8. 数据清洗
  9. 不均衡数据处理
  10. 缺失值处理
  11. 异常值处理
  12. 特征处理
  13. 特征缩放
  14. 数值离散化
  15. 特征编码
  16. 时间数值转换

第7天  特征选择

  1. 特征选择
  2. 特征选择概述
  3. Filter
  4. Wrapper
  5. Embedded
  6. 其他方法和特征扩增
  7. 降维
  8. 降维导入
  9. SVD
  10. PCAu
  11. LDA
  12. LLE
  13. Quiz
  14. 实验

第8天  有监督学习

  1. 有监督学习的预备知识
  2. 机器学习分类
  3. 模型评估
  4. 线性回归
  5. 误差
  6. 正规方程
  7. 梯度下降
  8. 正则化
  9. KNN算法
  10. 决策树
  11. SVM算法
  12. 线性回归
  13. 逻辑回归算法
  14. 集成算法

第9天 无监督学习

  1. 无监督学习概述
  2. 聚类算法
  3. Apriori算法
  4. FP-growth算法

第10天

数据挖掘综合应用

  1. 数据挖掘的流程
  2. 数据挖掘流程概述
  3. 分析需求
  4. 数据读取
  5. 数据预处理
  6. 特征工程
  7. 特征选择
  8. 模型选择
  9. 模型评估
  10. 综合应用的案例分析

第11天 Scala编程基础

  1. Scala基础语法
  2. 数据类型
  3. 变量
  4. 循环
  5. 函数
  6. 数组
  7. 类和对象
  8. 模式匹配
  9. 文件读写

第12天

SparkMLib数据挖掘

  1. Spark MLlib 基础入门
  2. Spark MLlib 矩阵向量
  3. Spark MLlib 基础统计分析
  4. Spark MLlib 特征提取和转换
  1. Spark MLlib 分类与回归
  2. Spark MLlib 聚类与降维
  3. Spark MLlib 关联规则与推荐算法
  4. Spark MLlib 评估矩阵

第13天

华为机器学习服务MLS

  1. 华为 MLS 服务介绍
  2. 申请华为 MLS 服务
  3. 创建华为 MLS 工作流
  4. 典型算法的应用
  5. 机器学习平台 FusionInsight Miner
  6. 大数据架构概述
  7. 大数据架构在大数据中的重要性
  8. 大数据架构师所具备的能力
  9. 如何构建大数据架构平台
  10. 大数据业务层通用架构
  11. 大数据治理概述
  12. 大数据治理建设背景和目标
  13. 企业数据规划及治理模型
  14. 大数据治理案例

第14天

大数据挖掘综合实验

  1. 数据挖掘背景
  2. 银行客户精准画像案例
  3. 提升信用卡安全案例
  4. 城市环境质量分析挖掘案例

 

下载课程大纲