一、项目简介
大数据是指对规模庞大的数据库或者数据池进行挖掘、清理、分析的过程。大数据可以概括为5个V,数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)、真实性(Veracity)。通过对大数据进行全面的分析和挖掘,数据分析出的结论会为企业带来更多的商业价值和利益。越来越多的大数据分析技术人员,正在各行各业充分合理利用大数据更好的促进生产、流通、分配、消费活动的高效良性的发展,提升经济运行机制,加快改善社会生活方式。
大数据分析师人才培养标准不仅仅是一套涵盖了最新的大数据知识、产品和技术架构的课程,还包含了知识体系测定、学习路径规划、技术学习和操作练习、水平测定与工作推荐等完整的服务体系。为各个学习阶段的学员,以不同的知识结构、技术基础,最终进入到IT行业并从事大数据方面工作提供了完整的解决方案。大数据分析师职业技术能力培养体系将能力发展通道由低到高划分为三个级别,分别为:初级、中级和高级。
二、报考条件
1、初级: (满足以下之一皆可报名)
(1)取得初级标准所要求培训学时证明,
(2)具备相关中等专科及以上学历(含在读的应届生)。
2、中级: (满足以下之一皆可报名)
(1)取得中级标准所要求培训学时证明,
(2)获得初级职业技术证书。
(3)专科及以上学历从事相关工作 1 年以上
(4)专科以下学历从事相关工作 2 年以上
3、高级: (满足以下之一皆可报名)
(1)取得高级标准所要求培训学时证明,
(2)获得中级职业技术证书。
(3)本科及以上学历从事相关工作 3 年以上
(4)本科以下学历从事相关工作 4 年以上
(注:上述相关工作年限不限制行业)
三、考试方式
考试方式分为线下考试站点或线上考试系统统考两种方式,考试形式为上机答题,闭卷。
四、考试内容
初级: 120分钟,客观题(单选+多选),上机答题。
中级: 120分钟,主观题+客观题(单选+多选+案例操作),上机答题。
高级:120分钟, 主观题+客观题(单选+多选+案例操作),上机答题。
五、考试地点
各地授权考试站点或在线考试系统
六、课程大纲
<初级>--大数据分析师职业技术课程大纲 | |
大数据导论 | 数据分析概述 |
第1模块: 大数据与人工智能 课时 1 : 2.1.1 理解大数据 课时 2 : 2.2.1 认识大数据时代 课时 3 : 2.2.2 大数据思维的特点 课时 4 : 2.2.3 大数据的应用 课时 5 : 2.2.4 大数据时代的企业案例 | 第1模块: Python数据分析概述 课时 1 : 1.1认识数据分析 课时 2 : 1.2熟悉Python数据分析的工具 |
Excel数据分析基础与实战 | Power BI数据分析与可视化 |
第1模块: Excel2016概述 课时 1 : 1.1 认识数据分析 课时 2 : 1.2认识Excel 2016 第2模块: 外部数据的获取 课时 3 : 2.1获取文本数据 课时 4 : 2.2从数据库获取数据 第3模块: 数据处理 课时 5 : 3.1排序 课时 6 : 3.2筛选 课时 7 : 3.3分类汇总 第4模块: 公式应用 课时 8 : 4.1认识公式和函数 课时 9 : 4.2数组公式 课时 10 : 4.3日期和时间函数 课时 11 : 4.4数学函数 课时 12 : 4.5统计函数 课时 13 : 4.6文本函数 课时 14 : 4.7逻辑函数 第5模块: 数据透视表和透视图 课时 15 : 5.1透视表的创建和修改 课时 16 : 5.2透视表的操作 课时 17 : 5.3透视图的操作 第6模块: 数据分析与可视化 课时 18 : 6.1对比分析. 课时 19 : 6.2趋势分析 课时 20 : 6.3饼图 课时 21 : 6.4散点图 课时 22 : 6.5雷达图 第7模块: 处理新零售智能销售数据分析项目的数据 课时 23 : 7.1案例背景 课时 24 : 7.2数据预处理 第8模块: 分析商品销售情况 课时 25 : 8商品销售分析 1第9模块: 分析商品库存 课时 26 : 9库存分析 第10模块: 用户分析报告 课时 27 : 10用户分析 课时 28 : 11分析报告 | 第1模块: 认识Power BI 课时 1 : 1.1 认识数据分析 课时 2 : 1.2 了解可视化工具 课时 3 : 1.3 认识power bi 第2模块: 数据获取 课时 4 : 2.1 数据来源 课时 5 : 2.2 获取数据 第3模块: M语言数据预处理 课时 6 : 3.1 认识编辑器和M语言 课时 7 : 3.2 数据集成 课时 8 : 3.3 数据清洗 课时 9 : 3.4 转换数据 课时 10 : 3.5 数据泛化 第4模块: DAX语言数据建模 课时 11 : 4.1 认识DAX语言 课时 12 : 4.2 构建日历表 课时 13 : 4.3 构建表间关系 课时 14 : 4.4 度量值 第5模块: 数据分析可视化 课时 15 : 5.1 认识可视化 课时 16 : 5.2条形图和柱状图 课时 17 : 5.3 雷达图和漏斗图 课时 18 : 5.4 饼图和环形图 课时 19 : 5.5 瀑布图和树状图 课时 20 : 5.6 折线图和散点图 课时 21 : 5.7 描述性分析 课时 22 : 5.8 KPI分析 第6模块: Power BI数据分析报表 课时 23 : 6.1 认识分析报表 课时 24 : 6.2 制作分析报表 第7模块: 数据部署 课时 25 : 7 部署 第8模块: 案例 课时 26 : 8.1 案例背景 课时 27 : 8.2 数据清洗 课时 28 : 8.3 数据规约 课时 29 : 8.4 数据建模 课时 30 : 8.5 销售分析 课时 31 : 8.6 库存分析 课时 32 : 8.7 用户分析 课时 33 : 8.8 部署和发布 |
大数据分析师(初级)职业技术考试 | |
<中级>--大数据分析师职业技术课程大纲 | |
数据挖掘概述 | Python编程基础 |
课时 1 : 1.1 数据挖掘发展史 课时 2 : 1.2 数据挖掘的基本任务 课时 3 : 1.3 数据挖掘的通用流程 课时 4 : 1.4 常用数据挖掘建模工具 课时 5 : 1.5 Python数据挖掘的环境配置 | 第1模块: 数据挖掘基础 课时 1 : 1.5 Python数据挖掘的环境配置 第2模块: Python数据挖掘编程基础 课时 2 : 2.1.1 基本运算 课时 3 : 2.1.1 列表或元组 课时 4 : 2.1.1 集合 课时 5 : 2.1.1 字典 课时 6 : 2.1.2 判断与循环 课时 7 : 2.1.3 函数 课时 8 : 2.1.3 函数式编程 课时 9 : 2.1.3 库的导入与添加 课时 10 : 2.2~2.3 Python数据分析常用库和数据挖掘建模常用库与框架 |
科学计算包NumPy | 大数据数学基础 |
科学计算包NumPy 课时 1 : 2.1.1Numpy简介 课时 2 : 2.1.2 数组创建及基础属性 课时 3 : 2.1.3 初识数组的特点 课时 4 : 2.1.4 创建常用数组 课时 5 : 2.1.5 数组数据类型 课时 6 : 2.1.6 生成随机数 课时 7 : 2.1.7 一维数组的索引 课时 8 : 2.1.8 逻辑型索引 课时 9 : 2.1.9 多维数组的索引 课时 10 : 2.1.10 求解距离矩阵 课时 11 : 2.1.11 变化数组shape 课时 12 : 2.2.1 Numpy矩阵介绍 课时 13 : 2.2.2 Numpy通用函数介绍 课时 14 : 2.2.3 通用函数的广播机制 课时 15 : 2.3.1 Numpy读写二进制文件 课时 16 : 2.3.2 Numpy读写txt文件 课时 17 : 2.3.3 利用Numpy对数据进行简单统计分析 | 第1模块: 第1章 绪论 课时 1 : 1 绪论 第2模块: 第2章 微积分基础 课时 2 : 2.1 引言 课时 3 : 2.2 函数与极限 课时 4 : 2.3 导数与微分 课时 5 : 2.4 微分中值定理与导数的应用 课时 6 : 2.5 不定积分与定积分 第3模块: 第3章 概率论与数理统计基础 课时 7 : 3.1.1.1 集中趋势度量 课时 8 : 3.1.1.2 集中趋势度量代码讲解 课时 9 : 3.1.2.1 离散趋势度量及偏度与峰度度量 课时 10 : 3.1.2.2 离散趋势度量及偏度与峰度度量代码讲解 课时 11 : 3.2.1 随机事件及其概率 课时 12 : 3.2.2 随机变量与概率分布 课时 13 : 3.2.3 随机变量的数字特征 课时 14 : 3.2.4 随机变量与概率分布及随机变量的数字特征代码讲解 课时 15 : 3.3 参数估计与假设检验以及章节小结 第4模块: 第4章 线性代数基础 课时 16 : 4.1.1 行列式 课时 17 : 4.1.2 行列式代码讲解 课时 18 : 4.2.1 矩阵及其运算 课时 19 : 4.2.2 矩阵及其运算代码讲解 课时 20 : 4.3.1 矩阵的特征分解与奇异值分解 课时 21 : 4.3.2 矩阵的特征分解与奇异值分解代码讲解 |
数据可视化 | 考试 |
课时 1 : 1.1 Matplotlib绘制流程说明 课时 2 : 1.2 添加文本和修改绘图风格 课时 3 : 1.3 rc参数 课时 4 : 1.4 散点图 课时 5 : 1.5 折线图 课时 6 : 1.6 直方图和条形图 课时 7 : 1.7 饼图 课时 8 : 1.8 箱线图 课时 9 : 1.9 人口特征间分布 课时10 : 1.10 人口各个特征分布 | 大数据分析师(中级)职业技术考试 |
<高级>--大数据分析师职业技术课程大纲 | |
数据探索 | Python数据预处理 |
数据探索 课时 1 : 3.1.1 一致性校验 课时 2 : 3.1.2 缺失值校验 课时 3 : 3.1.3 简单统计量分析 课时 4 : 3.1.3 IQR准则和3西塔原则 课时 5 : 3.1.3 箱型图分析 课时 6 : 3.2.1 集中趋势度量 课时 7 : 3.2.1 离中趋势度量 课时 8 : 3.2.2 定量数据分布分析 课时 9 : 3.2.2 定性数据分布分析 课时 10 : 3.2.3 对比分析 课时 11 : 3.2.4 周期分析 课时 12 : 3.2.5 贡献度分析 课时 13 : 3.2.6 相关性分析 | Python数据预处理 第1模块: 数据预处理 课时 1 : 4.1.1 数据清洗-记录重复 课时 2 : 4.1.2 数据清洗-属性内容重复 课时 3 : 4.1.3 数据清洗- 缺失值处理&异常值处理 课时 4 : 4.2.1 数据标准化 课时 5 : 4.2.2 数据离散化-等宽法 课时 6 : 4.2.3 数据离散化-等频法 课时 7 : 4.2.4 数据离散化-聚类法 课时 8 : 4.2.5 独热编码 课时 9 : 4.3.1 堆叠合并 课时 10 : 4.3.2 主键合并 课时 11 : 4.3.3 重叠合并 课时 12 : 4.3.4 分组聚合-groupby方法 课时 13 : 4.3.5 分组聚合-agg方法 课时 14 : 4.3.6 分组聚合-apply和transform方法 |
Python数据分析与挖掘 | 考试 |
Python数据分析与挖掘 第1模块: 数据挖掘算法基础 课时 1 : 5.0 构建线性回归模型 课时 2 : 5.1 构建逻辑回归模型 课时 3 : 5.2 构建决策树模型 课时 4 : 5.3 构建KNN模型 课时 5 : 5.4 构建非线性支持向量机 课时 6 : 5.5.1 神经网络原理 课时 7 : 5.5.2 构建神经网络模型 课时 8 : 5.6.1 集成算法原理 课时 9 : 5.6.2 集成算法代码实现 课时 10 : 5.7.1 Kmeans聚类算法原理 课时 11 : 5.7.2 kmeans聚类算法实现 课时 12 : 5.7.3 密度聚类算法原理 课时 13 : 5.7.4 密度聚类实现 课时 14 : 5.7.5 层次聚类 课时 15 : 5.7.6 层次聚类模型实现 课时 16 : 5.8.1 关联规则原理 课时 17 : 5.9.1 智能推荐原理 课时 18 : 5.9.2 基于用户的协同过滤推荐(1)-计算用户相似度 课时 19 : 5.9.3基于用户的协同过滤推荐(2)- 预测评分 课时 20 : 5.9.4 基于用户的协同过滤推荐(3)- 模型评价 课时 21 : 5.9.5 基于物品的协同过滤推荐-计算物品相似度 课时 22 : 5.9.6 基于物品的协同过滤推荐-推荐与评价 课时 23 : 5.9.7 基于流行度的推荐-计算动漫热度 课时 24 : 5.9.8 基于流行度的推荐-推荐评价 课时 25 : 5.10.1 时间序列原理 课时 26 : 5.10.2 时间序列-预处理 课时 27 : 5.10.3 时间序列-模型构建 | 大数据分析师(高级)职业技术考试 |
七、报名服务
进入报名统或联系客服人员进行报名,报名成功后工作人员为您开通课程及考试账号。考试完成后7个工作日可登录系统查询成绩,通过者获得相应的职业技术证书,纸质证书将在考试后90个工作日内寄送。
八、考试成绩
考试后7个工作日出成绩,总成绩100分,60分及以上皆为通过考试并获得职业技术证书,60分以下为不通过。
九、证书颁发
经学习及考试合格,由工业和信息化部教育与考试中心颁发大数据分析师职业技术证书,证书可登录国家工信部教育与考试中心官网查询。
附:证书样本
十、联系方式