×

  首页 >   全部课程 > R语言数据分析

R语言数据分析

企业定制,团体报名请您

在线预约

课程代码:2135培训课时:30课时(4天)

该班级优惠招生中 在线咨询

备注:详情可拨打 400-690-6115 或在线咨询客服人员

课程简介

本课程建立在R语言基础课程之上。本课程重在实践,将以多个案例的形式,介绍完整的数据分析的流程,从数据模型建立到数据清洗到可视化的过程。学员在这个课程中,将学习如何使用原始数据建立分析模型,根据不同的目标使用不同的数据分析方法,并通过绘图的方式,最终实现数据的可视化。

学员基础

? 要求学员有数学基础,掌握R语言基本语法

? 参加了R语言基础课程

课程目标

展示全部

课程大纲


模块名称

课程内容

原始数据的探索与预处理

1. 度量数据集的集中程度

2. 度量数据集的分散程度

     1) 极值,方差和标准差

     2)标准误和偏差系数,峰度系数

3. 创建一个数字摘要表

4. 异常值的观测与说明

     1)利用箱线图观测异常值并处理

     2)异常值检测的其他情况和说明

5. 缺失值的填补与处理

     1)删除缺失值或对其进行简单填补

     2)按照相关性对空缺值进行填补

R的数据可视化

1.  plot()函数和常用的图形参数

     1)设置plot()函数中的参数

     2)修改散点图的坐标并加入标注

2. 经典的基础图形及用途

     1)线图

     2)直方图

     3)箱线图和茎叶图

3. 将图形组合起来

4. 更多的高水平作图函数

5. 更多的常用作图命令

R中参数的估计和检验

1. 使用R进行点估计和区间估计

     1) 简单的点估计和区间估计

     2 )估计单侧置信区间

2. 与正态总体有关的参数检验

3. 列联表与独立性检验

4. 集中检验数据分布的函数

5. 对非正态总体的区间估计和检验

 1)非正态总体的区间估计

 2)非参数检验中的符合检验

 3)非参数检验中的秩检验

R中的方差分析

1. 方差分析模型的建立

2  .单因素方差分析

     1)单因素方差分析的数学思想与模型

     2)检验样本是否满足方差分析的假设条件

     3)构建单因素方差分析模型

3. 多因素方差分析

 1)多因素方差分析的数学思想与模型

 2)不考虑交互作用的双因素方差分析

 3)考虑交互作用的双因素方差分析

4. 秩检验和协方差分析

 1)对控制变量应用秩检验方法

    2)协方差分析的假设与应用

R中的相关分析和回归分析

1. 多种相关系数的计算和检验

     1)简单相关系数的计算和检验

 2)散步矩阵图和偏相关系数

 3)典型相关分析

2. 线性回归分析及其常归参数

 1)对数据进行预处理

 2)构建第一个回归模型

 3)修正方程并检验残差

3. 使用逐步回归筛选自变量

 1)逐步回归的思想与分类

 2)构建逐步回归模型

4. 哑变量和逻辑回归

 1)哑变量和逻辑回归的思想

 2)向线性回归模型中纳入哑变量

更高级的数据可视化

1. 基础图形的扩展与延伸

 1)绘制分类散点图并添加图标

 2)绘制含多种类别的密度分布图

 3)复合条形图和堆栈条形图

2. 有关多元分布函数的特殊图形

 1)星图和脸谱图

 2)轮廓图

 3)调和曲线图

3. 建立最简单的3D图形

4. 如何让图形更美观

5. 更过的绘图包和系统

R中的聚类分析和判别分析

1. 集中聚类分析的异同

2. 使用R实现KNN聚类

 1KNN算法的思想和模型

 2)使用R实现KNN聚类

3. 使用R实现系统聚类

 1)系统聚类的思想和模型

 2)使用R实现系统聚类

4. 使用R实现快速聚类

 1)快速聚类的思想和模型

 2)使用R实现快速聚类

5. 集中判别分析模型综述

 1)距离判别模型

 2Fisher判别模型

R中的主成分分析和因子分析

1. 主成分分析的实现与应用

 1)主成分分析的模型假设和数据处理

 2)构造一个主成分分析模型

 3)计算主成分的综合得分

2. 因子分析的初次构建与完善

 1)构造一个简单的因子分析模型

 2)计算因子得分并分析

3. 对因子分析模型进行修正

 1)修改因子分析模型中的因子个数

 2)基于主成分法和主轴因子法进行因子分析

4. 在降维分析的基础上进行回归分析和聚类分析

  1)在降维分析的基础上进行回归分析

  2)在降维分析的基础上进行聚类分析

5. 决策树

  1C4.5算法

  2CART算法

  3C5.0算法

R中的广义线性回归模型

1. 一般的广义线性回归模型

 1) 使用二次函数拟合线性回归模型

 2) 拟合更多的广义线性模型

 3) 比较线性模型的优劣

2.  Logistic线性回归模型

1Logistic模型的原理与构建方法

2Logistic模型的显著性检验和优势比

3)修正被警告的Logistic模型

3. 泊松回归分析模型

1) 拟合第一个泊松回归模型

2) 泊松回归模型的过散布检验

4. 广义线性模型的交叉验证

R中的时间序列模型

1. 将数据转换为时间序列格式

1) 使用ts()函数转换数据格式并绘制时间序列曲线

2) 使用zoo()函数转换数据格式并绘制时间序列曲线

2. 分解时间序列并检验时间序列的自相关性

1) 使用经典方法分解时间序列

2) 使用STL方法分解时间序列

3. 探究时间序列的自相关性

1) 使用月图和季度图探究自相关性

2) 使用散点图探究自相关性

4. 构建时间序列并预测

1) 均值预测,单纯预测和漂移

2) 不考虑长期趋势和季节波动的简单指数平滑

3) 在指数平滑中加入长期趋势和季节波动

4) 自回归移动平均模型

R中的最优化问题

1. 最优化问题简述

2. 黄金分割法

1) 黄金分割法和局部最优解

2) 使用R实现黄金分割法

3. 牛顿最优化方法

1) 牛顿方法的算法原理

2) 在一维情形下实现牛顿迭代法

3) 在多维情形下实现牛顿迭代法

4. 最快上升法

1) 利用梯度求解上升最快的相邻点

2) 构建最快上升法函数并检验

5.  R中最优化函数

使用R绘制地理信息图形

1. 绘制世界,国家,省市地图

1) 使用map()函数绘制地图

2) 另一种绘制地图的方法

3) 分省市绘制地图

2. 向地图中添加颜色

1) 向地图中添加颜色前的准备工作

2) 在地图上添加颜色

3. 向地图上添加标签和线条

1) 向地图中添加标签前的准备工作

2) 在地图上添加标签

3) 在地图上添加线条

4. 使用其他格式的文件优化地图

使用R构建支持向量机

1. 构建一个简单的支持向量机

1) 支持向量机的算法原理

2) 构建一个简单的支持向量机

3) 使用其他核函数构建支持向量机

2. 优化支持向量机的参数

1) 优化参数degree

2) 优化参数cost

3) 优化参数gamma

3. 比较支持向量机与Logistic回归的优劣

4. 比较支持向量机和KNN聚类算法的优劣

构建电影评分预测模型

1. 获取数据并探索

2. 利用recommenderlab包处理数据

3. 建立模型并评估

1) 模型的选择与建立

2) 模型之间的比较和评估

贝叶斯垃圾邮件过滤器模型

1. 贝叶斯模型中的条件概率

2. 复杂的数据预处理过程

1) 利用for循环读入多封邮件正文

2) 利用tm包进一步转换数据格式

3) TDM转换成真正有用的数据框

3. 利用occurrece值构造分类器

1) 完成理论准备并处理测试邮件和普通邮件

2) 创建一个函数用于比较概率

可视化数据挖掘工具Rattle内置

1. Rattle简介及其安装

1) Rattle简介

2) Rattle安装

2. 功能预览

3. 数据导入

1) 导入CSC数据

2) 导入ARFF数据

3) 导入ODBC数据

4) R Dataset—导入其他数据源

5) 导入RData File数据集

6) 导入Library数据

4. 数据探索

1) 数据总体概况

2) 数据分布探索

3) 相关性

4) 主成分

5) 交互图

5. 数据建模

1) 聚类分析

2) 关联规则

3) 决策树

4) 随机深林

6. 模型评估

1) 混淆矩阵

2) 风险图

3) ROC图及相关图表

4) 模型得分数据集

关联课程
本课程主要是大数据分析的前端开发内容,和本课程关联的是大数据相关课程。

课程名称

课程简述

阿里云大数据

作为阿里云上云培训的入门课程之一,无论您是架构师、还是开发者,本课程通过对阿里云主要的数据类产品以及对常见场景的解决方案的介绍,带您快速开启您的大数据之旅。课程由专业的阿里云认证讲师主讲,结合丰富的实验资源,通过讲解和演示,向您介绍阿里云数据类的产品DRDS、表格存储、MaxCompute、分析型数据库、大数据开放平台(Data IDE)的技术和解决方案等。

华为云大数据

本课程涵盖华为FusionInsight HD解决方案架构、设计、部署和维护,大数据常用组件技术原理、设计、部署、管理与维护(包括HBase, Hive, Loader, MR, YARN, HDFS, Spark, Flume, Solr, Hue, Kafka, Kerberos, Oozie, Zookeeper, Streaming)。

Cloudera 大数据平台

Cloudera认证Apache Hadoop培训及认证帮助您进阶大数据知识及技能,帮助学员综合理解并全面掌握通过Cloudera ManagerHadoop机群的运维管理,包括:安装,配置、负载平衡及性能调优等。通过该培训,Hadoop系统管理员将能准备好应对实际运维中遇到的挑战。





课程推荐

  • PowerPoint专项应用——PPT商用演示文稿设计与专业演讲

    课程代码:X209培训课时:6小时


    本课程由培训经验10年以上的专业讲师精心设计,提升学员利用PPT进行演讲的专业能力;掌握演示文稿的节奏控制与演说表达的经典方法;学会运用互动、问答技巧,提升演讲、培训的效果;掌握幻灯片整体设计能力,将演示内容图形化、图示化、图表化直观表达。


  • 跨平台软件架构师

    课程代码:X404培训课时:24课时

    学习本课程将1、深入理解构架的重要性; 
    2、系统地掌握构架开发的技术和方法; 
    3、掌握构架分析的步骤和方法; 
  • PMP®项目管理

    课程代码:7052培训课时:63课时(共9天:5天精讲、3天考试辅导、1天串讲)

    PMP?是“Project Management Professional”的缩写,是由美国项目管理协会(PMI?)开发并推广的项目管理资格认证,也是目前国际项目管理界含金量最高的证书,在全球190多个国家和地区得到了高度认可。来自官方的最新数据显示,全球PMP?证书持有者的数量已经突破80万,中国大陆地区的PMP?数量已经超过13万,约占全球总量的1/6。PMP?认证培训所使用的教材为PMI主持开发的《项目管理知识体系指南(PMBOK指南)》,现在的最新版本是第5版。 中国大陆地区的PMP?考试由国家外国专家局负责组织实施,每年有四次考试,分别是三月、六月、九月和十二月,具体考试日期及考试相关问题请咨询东方瑞通的课程顾问。 PMP?培训的官方授权机构叫REP(Registered Education Providers ),东方瑞通是PMI?授权的REP?之一。 参加东方瑞通的PMP?项目管理培训可获得如下后续服务: 1、培训期间每个班都会配备班主任,全程为学员服务。 2、培训期间还会建立QQ群、微信群,考前全程提供在线辅导。 3、学员通过考试后,还可以参加东方瑞通组织的各种免费及收费活动,积攒PDU。

    PMP? is a registered mark of the Project Management Institute, Inc.

Q&A

此课程暂无问题

我要提问

姓    名:

手机号:

问题描述:

提示

老学员报名 非老学员报名