一、项目简介
机器学习(Machine Learning, ML)是一门多领域交叉学科,是人工智能的核心,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
机器学习工程师人才培养标准是一套专业化,科学化,系统化的课程知识体系,它含盖了知识体系测定、学习路径规划、技术学习和操作练习、水平测定与工作推荐等完整的服务体系。机器学习工程师需要在对计算机使用大量的数据集,并应用算法进行训练和预测。系统快速应用来自大型数据集的知识和训练来执行人脸识别、语音识别、物体识别、翻译和许多其他任务。机器学习工程师职业技术证书由低到高划分为三个级别:初级、中级和高级。
二、报考条件
1、初级: (满足以下之一皆可报名)
(1)取得初级标准所要求培训学时证明,
(2)具备相关中等专科及以上学历(含在读的应届生)。
2、中级: (满足以下之一皆可报名)
(1)取得中级标准所要求培训学时证明,
(2)获得初级职业技术证书。
(3)专科及以上学历从事相关工作 1 年以上
(4)专科以下学历从事相关工作 2 年以上
3、高级: (满足以下之一皆可报名)
(1)取得高级标准所要求培训学时证明,
(2)获得中级职业技术证书。
(3)本科及以上学历从事相关工作 3 年以上
(4)本科以下学历从事相关工作 4 年以上
(注:上述相关工作年限不限制行业)
三、考试方式
考试方式分为线下考试站点或线上考试系统统考两种方式,考试形式为上机答题,闭卷。
四、考试内容
初级: 120分钟,客观题(单选+多选),上机答题。
中级: 120分钟,主观题+客观题(单选+多选+案例操作),上机答题。
高级:120分钟, 主观题+客观题(单选+多选+案例操作),上机答题。
五、考试地点
各地授权考试站点或在线考试系统
六、课程大纲
<初级>--机器学习工程师职业技术课程大纲 | |
机器学习概述 | Python编程基础 |
第1模块: 机器学习绪论 课时 1 : 1.1引言 课时 2 : 1.2基本术语 课时 3 : 1.3假设空间&归纳偏好 第2模块: 模型评估与选择 课时 4 : 2.1经验误差与过拟合 课时 5 : 2.2评估方法 课时 6 : 2.3性能度量 课时 7 : 2.4性能度量Python实现 | 第1模块: 数据挖掘基础 课时 1 : 1.5 Python数据挖掘的环境配置 第2模块: Python数据挖掘编程基础 课时 2 : 2.1.1 基本运算 课时 3 : 2.1.1 列表或元组 课时 4 : 2.1.1 集合 课时 5 : 2.1.1 字典 课时 6 : 2.1.2 判断与循环 课时 7 : 2.1.3 函数 课时 8 : 2.1.3 函数式编程 课时 9 : 2.1.3 库的导入与添加 课时 10 : 2.2~2.3 Python数据分析常用库和数据挖掘建模常用库与框架 |
科学计算包NumPy | 数据探索 |
课时 1 : 2.1.1Numpy简介 课时 2 : 2.1.2 数组创建及基础属性 课时 3 : 2.1.3 初识数组的特点 课时 4 : 2.1.4 创建常用数组 课时 5 : 2.1.5 数组数据类型 课时 6 : 2.1.6 生成随机数 课时 7 : 2.1.7 一维数组的索引 课时 8 : 2.1.8 逻辑型索引 课时 9 : 2.1.9 多维数组的索引 课时 10 : 2.1.10 求解距离矩阵 课时 11 : 2.1.11 变化数组shape 课时 12 : 2.2.1 Numpy矩阵介绍 课时 13 : 2.2.2 Numpy通用函数介绍 课时 14 : 2.2.3 通用函数的广播机制 课时 15 : 2.3.1 Numpy读写二进制文件 课时 16 : 2.3.2 Numpy读写txt文件 课时 17 : 2.3.3 利用Numpy对数据进行简单统计分析 | 课时 1 : 3.1.1 一致性校验 课时 2 : 3.1.2 缺失值校验 课时 3 : 3.1.3 简单统计量分析 课时 4 : 3.1.3 IQR准则和3西塔原则 课时 5 : 3.1.3 箱型图分析 课时 6 : 3.2.1 集中趋势度量 课时 7 : 3.2.1 离中趋势度量 课时 8 : 3.2.2 定量数据分布分析 课时 9 : 3.2.2 定性数据分布分析 课时 10 : 3.2.3 对比分析 课时 11 : 3.2.4 周期分析 课时 12 : 3.2.5 贡献度分析 课时 13 : 3.2.6 相关性分析 |
Matplotlib数据可视化 | 考试 |
第1模块: Matplotlib 课时 1 : 1.1 Matplotlib绘制流程说明 课时 2 : 1.2 添加文本和修改绘图风格 课时 3 : 1.3 rc参数 课时 4 : 1.4 散点图 课时 5 : 1.5 折线图 课时 6 : 1.6 直方图和条形图 课时 7 : 1.7 饼图 课时 8 : 1.8 箱线图 | 机器学习工程师(初级)职业技术考试 |
<中级>--机器学习工程师职业技术课程大纲 | |
Python特征工程实战 | 机器学习算法实现 |
第1模块: 特征工程的概念 课时 1 : 1.1 特征工程是什么 课时 2 : 1.2 特征工程效果评估 课时 3 : 1.3 定性还是定量 课时 4 : 1.4 数据的4个等级介绍 课时 5 : 1.5 数据的4个等级演示 第2模块: 数据预处理 课时 6 : 2.1 探索性数据分析 课时 7 : 2.2 探究不同类别样本的血糖浓度 课时 8 : 2.3 缺失值探索 课时 9 : 2.4 删除缺失值 课时 10 : 2.5 构建基线模型 课时 11 : 2.6 网格搜索优化 课时 12 : 2.7 利用0进行缺失值填充的模型性能 课时 13 : 2.8 利用均值进行缺失值填充的模型性能 课时 14 : 2.9 标准化和归一化介绍 课时 15 : 2.10 结合机器学习流水线进一步优化 课时 16 : 2.11 数据预处理小结 第3模块: 特征构建 课时 17 : 3.1 特征构建引言 课时 18 : 3.2 分类数据的填充 课时 19 : 3.3 自定义分类数据填充器 课时 20 : 3.4 自定义定量数据填充器 课时 21 : 3.5 编码定类数据 课时 22 : 3.6 编码定序变量 课时 23 : 3.7 连续变量分箱 课时 24 : 3.8 在流水线中封装预处理操作 课时 25 : 3.9 拓展数值特征的模型基线 课时 26 : 3.10 多项式特征模型性能 第4模块: 特征选择 课时 27 : 4.1 特征选择介绍 课时 28 : 4.2 数据导入及探索 课时 29 : 4.3 基于皮尔逊相关系数的特征选择 课时 30 : 4.4 特征选择前后模型性能比较 课时 31 : 4.5 基于假设检验的特征选择 课时 32 : 4.6 基于树的特征选择 课时 33 : 4.7 特征选择后模型性能探索 课时 34 : 4.8 基于线性模型的特征选择 课时 35 : 4.9 小结 第5模块: 降维与特征转换 课时 36 : 5.1 特征转换介绍 课时 37 : 5.2 主成分分析(PCA)介绍 课时 38 : 5.3 PCA工作流程实现 课时 39 : 5.4 PCA方差分析 课时 40 : 5.5 利用sklearn实现PCA 课时 41 : 5.6 深入解释PCA之相关性探究 课时 42 : 5.7 深入解释PCA之线性变换 课时 43 : 5.8 深入解释PCA之数据分布探索 课时 44 : 5.9 PCA小结 课时 45 : 5.10 LDA工作流程及实现 课时 46 : 5.11 sklearn实现LDA 课时 47 : 5.12 LDA数据分布探索 课时 48 : 5.13 应用特征转换 课时 49 : 5.14 小结 第6模块: 特征学习 课时 50 : 6.1 特征学习介绍 课时 51 : 6.2 受限玻尔兹曼机(RBM)工作原理 课时 52 : 6.3 MNIST数字识别任务介绍 课时 53 : 6.4 MNIST数据准备 课时 54 : 6.5 PCA特征分析 课时 55 : 6.6 RBM特征学习 课时 56 : 6.7 构建基线模型 课时 57 : 6.8 加入PCA进行模型优化 课时 58 : 6.9 加入RBM进行模型优化 课时 59 : 6.10 多层受限玻尔兹曼机 第7模块: 案例分析:表情识别 课时 60 : 7.1 表情识别任务介绍 课时 61 : 7.2 读取数据 课时 62 : 7.3 提取特征脸 课时 63 : 7.4 构建基线模型 课时 64 : 7.5 加入PCA过程 课时 65 : 7.6 加入LDA过程 | 课时 1 : 6.1.1Scikit-Learn简介 课时 2 : 6.1.2 获取及认识datasets中的数据 课时 3 : 6.1.3 将数据集划分为训练集和测试集 课时 4 : 6.1.4 利用转化器进行数据转化操作 课时 5 : 6.2 构建并评价聚类模型 课时 6 : 6.3 构建并评价分类模型 课时 7 : 6.4.1 构建回归模型 课时 8 : 6.4.2 评价回归模型 |
Python数据预处理 | 考试 |
课时 1 : 4.1.1 数据清洗-记录重复 课时 2 : 4.1.2 数据清洗-属性内容重复 课时 3 : 4.1.3 数据清洗- 缺失值处理&异常值处理 课时 4 : 4.2.1 数据标准化 课时 5 : 4.2.2 数据离散化-等宽法 课时 6 : 4.2.3 数据离散化-等频法 课时 7 : 4.2.4 数据离散化-聚类法 课时 8 : 4.2.5 独热编码 课时 9 : 4.3.1 堆叠合并 课时 10 : 4.3.2 主键合并 课时 11 : 4.3.3 重叠合并 课时 12 : 4.3.4 分组聚合-groupby方法 课时 13 : 4.3.5 分组聚合-agg方法 课时 14 : 4.3.6 分组聚合-apply和transform方法 | 机器学习工程师(中级)职业技术考试 |
<高级>--机器学习工程师职业技术课程大纲 | |
Python机器学习算法原理与实现 | 神经网络与深度学习 |
课时 1 : 5.0 构建线性回归模型 课时 2 : 5.1 构建逻辑回归模型 课时 3 : 5.2 构建决策树模型 课时 4 : 5.3 构建KNN模型 课时 5 : 5.4 构建非线性支持向量机 课时 6 : 5.5.1 神经网络原理 课时 7 : 5.5.2 构建神经网络模型 课时 8 : 5.6.1 集成算法原理 课时 9 : 5.6.2 集成算法代码实现 课时 10 : 5.7.1 Kmeans聚类算法原理 课时 11 : 5.7.2 kmeans聚类算法实现 课时 12 : 5.7.3 密度聚类算法原理 课时 13 : 5.7.4 密度聚类实现 课时 14 : 5.7.5 层次聚类 课时 15 : 5.7.6 层次聚类模型实现 课时 16 : 5.8.1 关联规则原理 课时 17 : 5.9.1 智能推荐原理 课时 18 : 5.9.2 基于用户的协同过滤推荐(1)-计算用户相似度 课时 19 : 5.9.3基于用户的协同过滤推荐(2)- 预测评分 课时 20 : 5.9.4 基于用户的协同过滤推荐(3)- 模型评价 课时 21 : 5.9.5 基于物品的协同过滤推荐-计算物品相似度 课时 22 : 5.9.6 基于物品的协同过滤推荐-推荐与评价 课时 23 : 5.9.7 基于流行度的推荐-计算动漫热度 课时 24 : 5.9.8 基于流行度的推荐-推荐评价 课时 25 : 5.10.1 时间序列原理 课时 26 : 5.10.2 时间序列-预处理 课时 27 : 5.10.3 时间序列-模型构建
| 第1模块: 人工神经网络(Artificial Neural Network) 课时 1 : 5.1单个神经元介绍 课时 2 : 5.2经典网络结构介绍 课时 3 : 5.3神经网络工作流程演示 课时 4 : 5.4如何修正网络参数-梯度下降法 课时 5 : 5.5网络工作原理推导 课时 6 : 5.6网络搭建准备 课时 7 : 5.7样本从输入层到隐层传输的Python实现 课时 8 : 5.8网络输出的Python实现 课时 9 : 5.9单样本网络训练的Python实现 课时 10 : 5.10全样本网络训练的Python实现 课时 11 : 5.11网络性能评价 课时 12 : 5.12调用sklearn实现神经网络算法 第2模块: 神经网络 课时 13 : 4.1.1 神经网络概述 课时 14 : 4.1.2 人工神经网络的发展历史 课时 15 : 4.2 浅谈神经网络 课时 16 : 4.3 神经网络与深度学习 第3模块: 计算机视觉 课时 17 : 5.1.1 计算机视觉的概述 课时 18 : 5.1.2 计算机视觉的发展历史 课时 19 : 5.2 常见的计算机视觉技术 课时 20 : 5.3 计算机视觉与深度学习 课时 21 : 5.4.1 安防系统的构成与技术框架 课时 22 : 5.4.2 人脸识别的流程 课时 23 : 5.4.3 人脸识别的关键技术与常见应用 第4模块: 自然语言处理 课时 24 : 6.1 自然语言处理的概述 课时 25 : 6.2 自然语言处理的发展历程 课时 26 : 6.3 常见的自然语言处理技术 课时 27 : 6.4 自然语言处理与深度学习 |
机器学习工程师(高级)职业技术考试 |
七、报名服务
进入报名统或联系客服人员进行报名,报名成功后工作人员为您开通课程及考试账号。考试完成后7个工作日可登录系统查询成绩,通过者获得相应的职业技术证书,纸质证书将在考试后90个工作日内寄送。
八、考试成绩
考试后7个工作日出成绩,总成绩100分,60分及以上皆为通过考试并获得职业技术证书,60分以下为不通过。
九、证书颁发
学员经学习并考核合格后,由工业和信息化部教育与考试中心颁发机器学习工程师职业技术证书,证书可登录国家工信部教育与考试中心官网查询。
附:证书样本
十、联系方式