考试列表
报名须知
考试大纲
2018年第一次大数据分析师认证考试(初级)(时间:2018-09-01)
考试大纲

根据大数据分析师能力认证要求,以“了解”、“熟知”和“掌握”三个不同级别将每个知识点进行分解,建议考生按照不同的能力要求对相关知识点进行有针对性的学习。

了解:要求学员能够记忆规定知识点的有关内容,并能够领会知识点的内涵和外延,了解相关知识点之间的区别与联系。

熟知:要求学员必须熟记规定知识点的理论知识,并能够正确理解和记忆相关理论方法,根据考核的不同方式,作出逻辑严密的解释。

掌握:要求学员必须牢记知识点的相关内容,并能够结合常用工具进行实操演练,根据考核要求,对具体问题作出具体严密的流程设计和策略。


第一部分:理论基础

1.大数据理论基础

大数据概念及特性

了解:了解大数据概念及4V特性,领会大数据与普通数据的区别与联系。

大数据应用领域

了解:了解大数据的分布领域及常见应用,特别是社交媒体数据、金融欺诈大数据应用、零售业大数据应用、电信行业客户生命周期大数据应用等。

大数据发展及前瞻

了解:了解大数据的发展进程及发展趋势,了解大数据与人工智能、机器学习、物联网等相关领域的前瞻研究。

2.统计学基础

描述性统计分析

熟知:熟练掌握描述性统计方法,熟练掌握数据的计量尺度、集中趋势及分布统计方法,熟悉数据的相似性和相异性度量方法。

抽样估计

了解:了解总体与样本的概念,熟悉随机概率、抽样平均误差等的区间估计方法。

假设检验

了解:了解假设检验的基本概念,熟悉P值的含义及计算方法,了解P检验、Z检验、t检验等统计量的检验步骤。

方差分析

熟知:熟练掌握方法分析的概念,原理及基本步骤。

简单线性回归

掌握:熟练掌握简单线性回归的概念、原理及一般处理步骤,熟悉线性回归的应用领域及场景,能够运用相关工具进行线性回归分析,求解线性方程。

3.数据库基础

SQL概念

了解:了解SQL语言的基本原理,数据库及表的概念及原理

SQL一般查询语句

掌握:掌握一般SQL查询语言的基本结构,能够熟练应用查询语句进行数据查询处理

SQL连接语句

熟知:熟悉SQL连接语句,熟悉LEFT/RIGHT/INNER JOIN的用法及注意事项。

数据库高阶

了解:了解表创建、索引创建,了解数据的插入、删除、更新等

4.分析思维基础

金字塔原理

熟知:熟悉金字塔原理分析写作方法论,能够在业务中熟练运用相关知识进行需求沟通、分析框架搭建及分析报告撰写。

5.大数据相关技术

Hadoop的基础概念

了解:了解Hadoop的架构功能,技术框架涉及的基本概念。了解MapReduce、HDFS的基本工作原理,能看懂简单的系统配置。

HBase

了解:了解HBase在Hadoop生态圈中的功能,该技术点的特性。

Hive

了解:了解Hive在Hadoop生态圈中的功能,该技术点的特性。

Spark

了解:了解Spark在Hadoop生态圈中的功能,该技术点的特性。

Shell/Python

熟知:能运用脚本语言进行数据的分析提取。

Pig

了解:能跟踪分析Pig Latin到MapReduce的运算及转换。


第二部分:数据处理

1.数据属性

了解:了解数据的属性类型,特别需掌握二元属性、离散属性及连续属性等。

2.数据预处理

数据清洗

熟知:熟悉数据清洗的概念,能够针对不同场景运用不同清洗方法。

数据集成

了解:了解数据集成概念及基本方法。

数据变换

掌握:掌握数据变换的概念,原理;熟练掌握常用的数据变化方法Z-SCORES,最大值-最小值方法等。

数据规约

熟知:熟悉数据规约概念,原理,熟悉维规约一般方法及步骤。

3.探索性统计分析

原始数据基础可视化

熟知:熟悉处理阶段统计分析可视化方法,能够根据数据特性选择适当的可视化度量尺度。

衍生变量

了解:了解衍生变量的概念及必要性,熟悉使用衍生变量的场景及常用方法。


第三部分:数据挖掘

1.数据挖掘基础

熟知:熟悉数据挖掘的概念、原理及基本步骤,熟悉数据挖掘的分类及常用算法。

2.初步数据探索

熟知:熟悉数据探索的方法,能够运用数据挖掘工具进行初步数据探索,可进行变量初步筛选。

3.分类模型

分类基本概念

熟知:熟悉分类的概念,使用场景及常用算法。

分类一般步骤

熟知:熟悉常用分类算法的一般处理步骤,了解各算法的有点及缺点。

决策树分类挖掘方法

掌握:熟悉常用的决策树算法,能够运用数据挖掘工具进行决策树挖掘模型设计及结果输出。

朴素贝叶斯分类挖掘方法

了解:了解朴素贝叶斯算法的原理、了解贝叶斯算法的注意事项。

逻辑回归分类挖掘方法

掌握:掌握逻辑回归的算法原理、一般步骤及使用场景,能够运用挖掘工具进行逻辑回归建模。

分类器模型评估方法

掌握:掌握重要分类模型的评估方法,能够根据ROC曲线等可视化图形判断分类器优劣。

其他分类挖掘方法

了解:了解随机森林、支持向量机等其他分类挖掘算法思想,基本步骤。

4.聚类模型

聚类基本概念

熟知:熟悉聚类的概念,使用场景及常用算法。

聚类一般步骤

熟知:熟悉常用聚类算法的一般处理步骤,了解各算法的有点及缺点。

距离计算方法

掌握:掌握常用的距离计算方法,了解各种距离的适用场景。

划分聚类挖掘方法

掌握:掌握K-均值、K-中心点聚类方法的原理、一般步骤,能够运用挖掘工具进行划分聚类。

层次聚类挖掘方法

熟知:熟悉凝聚聚类和分裂聚类的概念、原理及相互关系。

聚类模型评估方法

掌握:掌握聚类模型的评估方法,能够根据评估度量解释模型优劣。

其他聚类挖掘方法

了解:了解基于密度、基于网格等聚类方法及适用场景。

5.关联规则

关联规则挖掘基本概念

熟知:熟悉关联的概念,使用场景及常用算法,了解算法见的优劣。

关联规则挖掘一般步骤

熟知:熟悉常用关联规则算法的一般处理步骤。

Apriori算法

掌握:掌握Apriori算法的原理、一般步骤及处理方法,能够适用挖掘工具进行关联规则挖掘。

关联规则评估方法

掌握:掌握有效关联规则的评估方法,能够根据相关度量对隐藏规则进行解释。

其他关联算法

了解:了解FP-Tree算法原理及算法优劣。

6.预测

回归基础

熟知:熟知多元回归等回归算法原理、处理步骤,适用场景,能够根据实际问题,计算回归公式。

回归诊断

熟知:熟悉回归诊断方法,能够根据诊断结果对回归模型进行解释。

时间序列一般步骤

了解:了解时间序列模型的概念、一般流程及使用场景。

时序的平滑化和季节性分解

熟知:熟悉时间序列数据的平滑化方法及季节性分解方法。

指数预测模型

了解:了解指数预测模型算法原理,能够根据时序数据的特征选择不同的指数预测模型方法。

ARIMA模型

了解:了解ARIMA预测模型原理。

7.文本挖掘分析

文本挖掘简介

熟知:了解文本挖掘工作方式,熟知一般流程。

情绪分析

了解:了解情绪分析方法、分析要素及分析流程。

文本挖掘应用

了解:了解文本挖掘的一般工具,了解社交媒体、在线分析关键要素。

8.移动分析

移动分析简介

了解:了解移动分析概念及类型,了解移动分析的商业价值。

执行移动分析

熟知:熟知移动分析的基本流程,了解移动分析的基本工具。


第四部分:数据可视化

1.可视化概念

了解:了解大数据可视化的概念及重要性。

2.大数据可视化技术、类型及应用

了解:了解大数据可视化相关技术、类型及应用。



【参考书目】

1:统计学(第七版) 贾俊平,金勇进,何晓群 中国人民大学出版社 2018年01月 

2:数据挖掘:概念与技术(原书第3版)JiaweiHan,MichelineKamber,Jian Pei机械工业出版社 2012年8月

3:SQL必知必会(第4版) (美)福达 人民邮电出版社 2013年05月 

4:大数据思维与决策 (美) 伊恩·艾瑞斯 人民邮电出版社 2014年09月 

5:金字塔原理 (美)芭芭拉.明托 南海出版公司 2013年11月 

6:大数据时代 (英) 迈尔-舍恩伯格 浙江人民出版社 2013年01月 

7:Hadoop大数据解决方案 Benoy Antony,Cazen Lee,Kai Sasaki 清华大学出版社 2017年03月  

8:Hadoop权威指南:大数据的存储与分析(第4版) (美)Tom White 清华大学出版社 2017年07月

9:数据算法:Hadoop/Spark大数据处理技巧 (美) Mahmoud Parsian 中国电力出版社 2016年10月 

10:大数据架构详解:从数据获取到深度学习 朱洁 电子工业出版社 2016年10月

11:机器学习、大数据分析和可视化Wrox国际IT认证项目组 人民邮电出版社2017年7月

12:大数据分析与预测建模 Wrox国际IT认证项目组 人民邮电出版社2017年11月

咨询电话 关于我们 联系我们 法律条款
86-10-6567 7878
©戎易商智(北京)科技有限公司   京ICP备12049996号-6
小提示框