在线实习

基于“互联网+”的大数据项目在线实习方案



一、实习背景

2014年2月7日习近平总书记在中央网络安全和信息化领导小组第一次会议上指出:“信息化和经济全球化相互促进,互联网已经融入社会生活方方面面,深刻改变了人们的生产和生活方式。”李克强总理在2015年《政府工作报告》中推出“互联网+”的概念,要求制定“互联网+”行动计划。现在“互联网+”已经渗透到社会的方方面面。

实习,在实践中学习,任何的知识源于实践,归于实践,最终也要通过实践进行检验,它是衔接学生在校学习与步入社会两个阶段的重要桥梁。一个好的实习机会,会帮助学生积累工作经验、验证职业选择、提升综合素质。但是,实际情况对于学生来说,找一份对口的实习工作常常面临诸多困难。

1、实习需求比较集中在一线城市,二三线城市或偏远地区有对口实习需求的企业屈指可数,实习企业也很难接受大规模学生同时实习的需求。

2、很多情况学生需要奔波到外地实习,伴随出现的是高额住宿费用和校外安全隐患。

3、在实习中往往很难接触到企业真实项目,多数同学实习期间都是在“打杂”,每日忙忙碌碌却学习不到有用的技能,竞争力无法提升,迈入职场时,仍是十分迷惘。

二、实习目标

1、弥补学生毕业后从事大数据相关企业工作经验

此次实习以企业真实项目为场景,充分感受真实的大数据挖掘过程及其所需要的技能和知识点。在实习过程中,围绕大数据挖掘的整个流程,从数据采集、数据迁移、数据挖掘、专题应用及数据可视化完整大数据挖掘流程,将课堂上所学到的理论知识应用到实践中,使其具备大数据挖掘相关企业开发项目的准入门槛,为毕业后就业奠定扎实的技能基础。

2、实习成果经验转换

本次实习优质的成果可以转换成创新创业的项目池,实习成果可以存储为教学档案,为以后专业的优化,人才培养定位,课程设置,提供良好的支撑系统材料,老师可将此次实习过程所总结的经验吸收进往后教学过程中,或者成立大数据与人工智能项目工作室,促进学生在大数据挖掘及数学建模,人工智能方面的可持续发展。

3、为学生的择业和就业提供帮助

近年来大数据分析挖掘岗位十分希缺,各企业纷纷成立大数据项目技术团队,但苦于招聘不到合适的人才,一个很重要的原因就是毕业生不具备大数据分析挖掘的实践能力。本次实习提供的企业级数据挖掘项目,能为学生选择数据挖掘岗位就业方向需注备的技能知识提供参考。在实习过程当中,能快速掌握大数据挖掘技术的知识技能,以弥补自己的知识不足,另外就是在实习过程当中,企业工程师和企业技术人员会以自身的从业经历,进行大数据岗位的就业指导,帮助学生实习之后能快速进入到就业前的工作状态,能对自己职业生涯有一个清晰的定位。

4、一次在线实习让学生同时收获:高含金量实习经历+HR认可的岗位核心能力+简历、面试等专业求职技能+优质职位机会。

4.1 全面实践实训行业的数据分析流程。流程包括但不限于:数据处理、数据探索、数据建模等。

4.2 熟练使用某一门语言作为工具解决项目问题。语言包括但不限于:R语言、Python等。

4.31获得企业实习证明,无需奔波满足实习需求。

4.4. 优秀学员获得CBDA大数据分析工程师证(基础级),国际高水平认证。

4.5 感受企业真实的实习场景,收获参与真实项目的实战经验。

4.6 丰富个人GitHub,项目论文、代码片段上传至GitHub存档。面试时,可直接向面试官展示自己的项目经验。

三、实习模式

1实习形式

按照学习计划,通过“泰迪云课堂”完成指定线上实习课程,并完成相关的课程作业。分阶段提交实习成果,由企业导师对实习成果进行考核打分,并记录档案;实习期末提交最终的实习项目报告,以远程的方式进行汇报,由企业导师进行点评,通过考核后获取实习证明;优秀学员在经过考核后可以获得由泰迪智能研究院国际培训中心颁发的CBDA大数据分析师(初级)证书。

2实习保障

2.1进度监控

2.1.1 要求学生每天云课堂打卡,后台进行统计,生成考勤记录。

2.1.2 后台监控每一个学生在云课堂的学习时间、学习进度;

2.1.3 课程视频设置跳题,防止学生只打开视频而不观看的行为;

3教学质量保障

3.1 实训项目精挑细选,流程设计完善,适用于实习场景。

3.2 课程讲师均是企业实际工程,且经过泰迪讲师培训考核。

3.3 每个班级群设讲师、助教等角色,保证学生提问都有专业负责答疑。

3.4 定期直播答疑,一般会根据学生提问情况进行收集,定期答疑。

3.5 每一次课程均设置在线作业;

4实习成果保障

4.1 每个学生实习完成需提交实习项目报告。

4.2 提供学生实习成绩单。

4.3 提供考勤记录。

4.4 提供实习证明。

4.5 优秀学员颁发CBDA认证证书。

5、实习安排流程

5.1 建立专属微信与QQ群,提供堂即时答疑与资料发放。

5.2 发放学生能力的调查问卷,对学生能力水平进行全面了解。

5.3 跟进学生实际情况,配置前置基础课程。

5.4 开班仪式讲解实习流程、常规操作、项目背景要求等内容。

5.5 分配课堂及项目任务,监督并指导学生完成相关任务。

5.6 根据学生疑问不定期直播答疑。

5.7 根据课程要求监督并指导学生提交实习作业。

5.8 结业仪式对项目进行完整解读、学生实习项目答辩报告及点评。

5.9 颁发实习证明及优秀学员颁发CPDA证书

四、实习安排

4.1实习合作方式

4.1.1实习类型:大数据专业项目实习

4.1.2实习形式:线上实习

4.1.3实习平台:泰迪云课堂。

4.1.4实习设备支持:手机端/PC 端均支持

4.1.5实习时间:4

4.2合作双方职责

4.2.1实习校方职责:

4.2.1.1指派实习指导教师,

4.2.1.2提供学生实习名单(姓名、专业、学号、班级),

4.2.1.3 组织学生报名,负责日常学生管理工作,

4.2.1.4 监督学生按时完成实习任务实习。

4.2.2实习企业方职责

4.2.2.1 指派行业导师,负责学生的实习带教与实习任务评定工作,

4.2.2.2 指派职业规划老师,负责日常学生管理工作,

4.2.2.3负责实习成绩评定并发送给校方,

4.2.2.4负责实习鉴定表实习单位盖章。

4.3实习成绩评定

4.3.1 评定构成:实习总成绩为100分:实习作品占比50%、分值为50分,实习出勤占比50%,分值为50分,成绩评定分为四个层级:优秀、良好、合格、不合格。

4.3.2 90 分以上为优秀,70 -89 分为良好,60 -70 分为合格,60 分以下不合格。

注:校方可根据实际要求修改分数构成和层级评定分数。

4.4实习计划

4.4.1第一部分:开班仪式

时间

内容

嘉宾

会议地点

时段一

会议流程及参会人员介绍

主持人

腾讯会议

时段二

大数据人才需求现状分析

企方项目经理

腾讯会议

时段三

实习课程安排、实训平台操作应用演示

企方项目经理

腾讯会议

时段四

校方领导发言

校方领导

腾讯会议

时段五

企方领导发言

企方领导

腾讯会议

时段六

会议总结、会议结束

主持人

腾讯会议

4.4.2第二部分: 基础专业课

时间

课程内容

上课地点

 

 

 

 

 

 

第一天

 

 

 

第一章 Python编程基础

1准备工作

2列表操作

3程序流程控制语句

4字符串操作

4.1字符串及其索引&切片

4.2字符串的常见方法

4.3字典的创建及索引

4.4字典常用操作

4.5字典推导式

 

泰迪云课堂

第二天

 

5Python文件读取操作

5.1Python读取文件

5.2练习3:统计小说中的单词频次

6函数

6.1Python函数自定义

6.2练习4:自定义求序列偶数个数的函数

7面向对象与模块

7.1Python方法与函数对比介绍

7.2Python面向对象示例

7.3Python模块使用

7.4第三方库的安装与调用

8注意事项

8.1Python工作路径说明

8.2模块命名及存放路径的注意事项

8.3结语

第三天

第二章 Python数据分析与应用

1 Python数据分析概述

1.1 认识数据分析

1.2 熟悉Python数据分析的工具

1.3 安装anaconda与掌握Jupyter Notebook常用功能

2 NumPy数值计算基础

2.1 掌握NumPy数组对象

2.1.1NumPy简介

2.1.2 数组创建及基础属性

2.1.3 初识数组的特点

2.1.4 创建常用数组

2.1.5 数组数据类型

2.1.6 生成随机数

2.1.7 一维数组的索引

2.1.8 逻辑型索引

2.1.9 多维数组的索引

2.1.10 求解距离矩阵

2.1.11 变化数组shape

2.2 掌握NumPy矩阵与通用函数

2.2.1 NumPy矩阵介绍

2.2.2 NumPy通用函数介绍

2.2.3 通用函数的广播机制

2.3 利用NumPy进行统计分析

2.3.1 NumPy读写二进制文件

2.3.2 NumPy读写txt文件

2.3.3 利用NumPy对数据进行简单统计分析

泰迪云课堂

 

 

第四天

3 Matplotlib数据可视化基础

3.1 掌握绘图基础语法与常用参数

3.1.1 Matplotlib介绍

3.1.2 基础图形绘制

3.1.3 常用参数设置

3.2 分析特征间关系

3.2.1 绘制散点图

3.2.2 散点图参数设置

3.2.3 绘制折线图

3.3 分析特征内部数据分布与分散情况

3.3.1 绘制直方图

3.3.2 绘制饼图

3.3.3 绘制箱线图

泰迪云课堂

第五天

4 Pandas统计分析基础

4.1 Pandas简介

4.2 读写不同数据源的数据

4.2.1 Pandas读取文本数据

4.2.2 存储数据框

4.2.3 Pandas读取excel文件

4.2.4 将数据框存储为excel文件

4.3 数据框与数据框元素

4.3.1 构建数据框

4.3.2 查看数据框的常用属性

4.3.3 按行列顺序访问数据框中的元素

4.3.4 按行列名称访问数据框中的元素

4.3.5 修改数据框中的元素

4.3.6 删除数据框中的元素

4.3.7 描述分析数据框中的元素

4.4 转换与处理时间序列数据

4.4.1 转换成时间类型数据

4.4.2 时间类型数据的常用操作

4.5 使用分组聚合进行组内计算

4.5.1 groupby分组操作

4.5.2 agg聚合操作

4.6 创建透视表与交叉表

4.6.1 生成透视表

4.6.2 生成交叉表

泰迪云课堂

 

 

 

第六天

使用Pandas进行数据预处理

5.1 合并数据

5.1.1 表堆叠

5.1.2 主键合并

5.1.3 重叠合并

5.2 清洗数据

5.2.1 检测与处理重复值

5.2.2 检测与处理缺失值

5.2.3 检测与处理异常值

5.3 标准化数据

5.4 转换数据

5.4.1 哑变量处理

5.4.2 离散化连续型数据

泰迪云课堂

第七天

第三章Python机器学习实战

1机器学习绪论

1.1引言

1.2基本术语

1.3假设空间&归纳偏好

2模型评估与选择

2.1经验误差与过拟合

2.2评估方法

2.3性能度量

2.4性能度量Python实现

3回归分析

3.1线性回归基本形式

3.2线性回归模型的Python实现

3.3波士顿房价预测的Python实现

3.4逻辑回归介绍

3.5研究生入学录取预测的Python实现


4.4.3 第三部分 职场技能课

职场技能课程大纲

课程内容

上课地点

一小时

第一章 求职就业渠道梳理

1.学习了解企业常用招聘手段

2.学习了解各类企业不同的招聘流程

3.学习了解线上招聘渠道

4.了解学习应聘的基本规划与方法

在线直播

一小时

第二章 简历与面试提升

1.了解掌握个人简历呈现技巧

2.识别HR 认为的面试中常见错误

3.学习面试中的所需要掌握的相关技能

在线直播

一小时

第三章 就业必备知识

1.了解学习三方协议、offer、劳动合同、五险一金、企业福利、入职材料、入职流程等

2.了解企业内部架构、汇报要求及职场常用工具

在线直播

一小时

第四章 职场学习

1、了解物流专业和信息管理与信息系统专业分别对应的不同企业类型行业发展趋势

2、了解物流专业和信息管理与信息系统专业未来职业发展路径

3、介绍物流专业和信息管理与信息系统专业分别对应的企业岗位的工作方式与工作内容

在线直播

4.4.4第四部分: 项目实训课(因篇幅受限,以下仅展示部分实训项目)

项目一  新零售无人智能售货机商务数据分析

时间安排

课程内容

上课地点

时间安排

课程内容

上课地点

第一周

 

1:项目准备

1.1  项目背景与TASK解读

1.2  项目数据下载

2:项目TASK解读

2.1  TASK-1 数据预处理与分析

2.2  TASK-2 数据分析与可视化

泰迪云课堂

第二周

 

2.3 TASK-3 自动售货机画像

2.4:TASK-4 业务预测

泰迪云课堂

第三周

 

3:项目成果提交

3.1 项目分析报告

3.2 项目交付模板

3.3 完善并提交项目成果

泰迪云课堂

项目二  热门电影短评数据爬取与分析

时间安排

课程内容

上课地点

第一周

TASK1:获取《复仇者联盟4》豆瓣短评数据

TASK1.1 使用Selenium打开网页

TASK1.2 使用XPath解析网页

TASK1.3 获取用户常居城市、注册时间

TASK1.4 循环获取

TASK1.5 数据存储

TASK2:分析短评关键思想

TASK2.1 预处理

TASK2.2 分词并去除停用词

泰迪云课堂

第二周

TASK2.3 词频统计

TASK2.4 绘制词云

TASK2.5 分别绘制好评、中评、差评的词云

TASK3:时间分析

TASK3.1 分析用户发表短评数量随日期的变化情况

TASK3.2 分析用户发表短评数量随时刻的变化情况

TASK3.3 分析随日期变化,评分变化情况

泰迪云课堂

第三周

TASK4:城市分析

TASK4.1 分析用户常居城市分布情况

TASK4.2 分析不同城市的评分情况

TASK5:用户会龄分析

TASK5.1 分析《复仇者联盟4》发布短评用户的会龄分布

TASK5.2 分析会龄对评分的影响

TASK6 项目交付

TASK6.1 完善项目文件

TASK6.2撰写分析报告

TASK6.3提交所有项目文件

泰迪云课堂

项目三  基于神经网络的人脸识别

时间安排

课程内容

上课地点

第一周

TASK1 :数据采集

TASK1.1 通过opencv调用电脑摄像头拍取约10个人,每人600张的人脸图像

TASK1.2 将拍取的照片按照人名文件夹保存

泰迪云课堂

第二周

TASK2 :人脸检测

TASK2.1 学习mtcnn原理,并利用mtcnn进行人脸检测

TASK2.2 对图片素材进行灰度处理,对处理后的数据进行整理

TASK3 :人脸识别建模

TASK3.1 掌握卷积神经网络基础概念

TASK3.2 利用卷积神经网络建立人脸识别模型

泰迪云课堂

第三周

TASK4 :模型评价与测试

TASK4.1 用建立好的模型对人脸部门进行检测,并得出具体的识别结果

TASK5 项目交付

TASK5.1 完善项目文件

TASK5.2撰写分析报告

TASK5.3提交所有项目文件

泰迪云课堂

项目四  学生校园消费行为分析

时间安排

课程内容

上课地点

第一周

TASK 1 :数据预处理

TASK 1.1 根据实际项目需求对数据进行必要的预处理。

TASK 1.2 分别对学生个人信息表和消费记录表,以及学生个人信息表和门禁记录表进行关联。

TASK 2 :食堂就餐行为分析

TASK 2.1 绘制各食堂就餐人次的占比饼图,分析学生早中晚餐的就餐地点是否有显著差别。

泰迪云课堂

第二周

TASK 2.2 过食堂刷卡记录,分别绘制工作日和非工作日食堂就餐时间曲线图,分析食堂早中晚餐的就餐峰值。

TASK 2.3 根据上述分析的结果,为食堂的运营提供建议。

TASK 3 :学生消费行为分析

TASK 3.1 根据学生的整体校园消费数据,计算本月人均刷卡频次和人均消费,并选择3个专业,分析不同专业间不同性别学生群体的消费特点。

泰迪云课堂

第三周

TASK 3.2 根据学生的整体校园消费行为,选择合适的特征,构建聚类模型,分析每一类学生群体的消费特点。

TASK 3.3通过对低消费学生群体的行为进行分析,探讨是否存在某些特征,能为学校助学金评定提供参考。

TASK 4项目交付

TASK 4.1完善项目文件

TASK 4.2撰写分析报告

TASK 4.3提交所有项目文件

泰迪云课堂

项目五  超市销售数据分析

时间安排

课程内容

上课地点

第一周

TASK 1:数据预处理与统计

TASK 1.1  根据项目需求对数据作必要的预处理。

TASK 1.2  统计每个大类商品的销售金额。

TASK 1.3  统计每个中类商品的促销销售金额和非促销销售金额。

TASK 1.4  统计生鲜类产品和一般产品的每周销售金额。

TASK 1.5  统计每位顾客每月的消费额及消费天数。

泰迪云课堂

第二周

TASK 2:数据分析与可视化

TASK 2.1  绘制生鲜类商品和一般商品每天销售金额的折线图,并分析比较两类产品的销售状况。

TASK 2.2  按月绘制各大类商品销售金额的占比饼图,并分析其销售状况。

TASK 2.3  绘制促销商品和非促销商品销售金额的周环比增长率柱状图。

泰迪云课堂

第三周

TASK 3:用户画像与促销策略

TASK 3.1  根据消费情况,分别为累计消费前10的顾客画像。

TASK 3.2  分析各大类商品的销售情况,总结其销售规律。

TASK 3.3  分析促销对商品销售的影响,为超市制定营销策略提供建议。

TASK 4项目交付

TASK 4.1完善项目文件

TASK 4.2撰写分析报告

TASK 4.3提交所有项目文件

泰迪云课堂

项目六  餐饮智能推荐服务

时间安排

课程内容

上课地点

第一周

TASK:计算菜品热销度

TASK 1.1 熟悉订单数据,并用Python读取

TASK 1.2 处理菜品名称字符数据

TASK 1.3 构建热销度评分指标

TASK 1.4 绘制条形图展示热销Top10

TASK 2 :数据预处理

TASK 2.1 统计每个订单状态的占比

TASK 2.2 选取有效的订单数据

TASK 2.3 选取主要特征

泰迪云课堂

第二周

TASK 3 :构建模型准备

TASK 3.1 将数据划分为训练集和测试集

TASK 3.2 构建客户 菜品二元矩阵

TASK 4 :构建推荐模型

TASK 4.1 将数据划分为训练集和测试集

TASK 4.2 自定义函数求菜品相似度矩阵

TASK 4.3 自定义函数进行推荐,并生成推荐列表

泰迪云课堂

第三周

TASK 5 :模型评价

TASK 5.1 构建测试用户IP字典,并去重

TASK 5.2 构建评价指标,并分析推荐效果

TASK 6项目交付

TASK 6.1完善项目文件

TASK 6.2撰写分析报告

TASK 6.3提交所有项目文件

泰迪云课堂

项目七  基于自动机器学习的水色图像水质评价

时间安排

课程内容

上课地点

第一周

TASK 1:图像数据抽取与处理

TASK 1.1 熟悉Python常用的图像处理库与函数,并读取图像数据

TASK 1.2 了解RGB图像,并根据像素点切割图像

TASK 2 :特征提取

TASK 2.1 了解颜色矩概念,并使用NumPy实现颜色矩计算

TASK 2.2 计算出切割后所有图像的颜色矩

泰迪云课堂

第二周

TASK 3 :图像分类模型构建

TASK 3.1 熟悉常用的分类算法,并使用这些分类算法实现图像分类

TASK 3.2 评价上述图像分类算法,并优化模型

泰迪云课堂

第三周

TASK 4 :评价图像分类算法

TASK 4.1 了解自动机器学习,并安装自动机器学习环境

TASK 4.2 使用TPOT框架实现图像分类

TASK 4.3 比较自动机器学习与自主构建的模型并分析其优劣势

TASK 5项目交付

TASK 5.1完善项目文件

TASK 5.2撰写分析报告

TASK 5.3提交所有项目文件

泰迪云课堂

注:以上为企业部分实习项目清单(更多项目选择请联系客服人员),可根据需要选择其中一个实习项目。

4.4.5 第五部分 结业仪式

时间

内容

嘉宾

会议地点

时段一

会议流程及参会人员介绍

主持人

腾讯会议

时段二

项目习总结

企方项目经理

腾讯会议

时段三

项目汇报答辩

实习学生小组长

腾讯会议

时段四

校方领导发言

校方领导

腾讯会议

时段五

企方领导发言

企方领导

腾讯会议

时段六

会议总结、会议结束

主持人

腾讯会议

五、费用及支付方式

在线实习费用包括:课程资源费、实习指导费、证书费等

具体收费标准如下:

收费标准

学生人数

实习费用/人

标准一

30以内

600 /

标准二

30~50 

550 /

标准三

50~80 

500 /

标准四

80以上

450 /


六、联系方式