课程详情 学校简介 学校地址 网上报名
大数据分析及可视化技术应用实战班培训—北京中培教育
¥5800元¥详询
课程介绍
关于举办大数据分析及可视化技术应用实战
培训班的通知
培训地点
北京
上海
广州
培训时间
5月
24-27
9月
22-25
12月
17-20
各有关单位:
“数据为王”的时代,大数据将带来一次全新的革命,将改变众多企业的命运。在大数据时代的背景下,R语言作为一种迅速兴起的数据挖掘和可视化工具软件,由于其功能强大、简洁易用,正越来越多的成为数据挖掘项目的实施基础。在数据挖掘和可视化的教学中,如果缺少相应的实际训练,是很难掌握好工具和理论的。本课程理论联系实际,经过具体案例贯穿所有的理论知识。针对游戏、医疗、汽车行业等不同领域应用问题,介绍数据挖掘及可视化的各个技术细节,经过实际的案例演练,让学员真正体验数据挖掘及可视化的强大魅力。中国信息化培训中心大数据研究院专注于大数据应用开发,特推出了大数据分析及可视化技术应用实战课程培训班,旨在培养大数据技术和应用创新型人才,促进大数据技术在各行业内部及跨行业进行实施应用,以及企业大数据分析及可视化项目开发和落地,并利用大数据打造企业核心竞争力优势。现将相关事宜通知如下:
一、课程特色
1. 本课程尽量避开数学公式,按照“讲清思想方法原理—结合具体案例—R语言实现细节”思路,让即使是几乎没有什么基础的学员,掌握数据挖掘和可视化的基本思路和模式,打下未来深入的良好基础,能在工作和学习中结合具体问题立马上手操作解决;
2. 课程注重学练结合的方法,会采取课中练习的方法,充分调动大家思考的积极性,在做中掌握相关知识和技能;
3. 课程紧紧抓住基于R语言的数据挖掘和可视化的重点和难点,详细的分析和讲解,在理解难、容易出错的地方反复提醒,以便学员在课后容易的进行自己复习和相关拓展。
二、 培训对象
1.大数据分析应用开发工程师
2.大数据分析项目的规划咨询管理人员
3.大数据分析项目的IT项目高管人员
4.大数据分析与挖掘处理算法应用工程师
5.大数据分析集群运维工程师
6.大数据分析项目的售前和售后技术支持服务人员
三、课程大纲
时间
知识模块
授课内容
第1天
上午
数据处理及复杂数据可视化(一)
第1讲 大数据挖掘及可视化介绍
Ø 数据挖掘及可视化背景
Ø 数据挖掘流程
Ø 常用挖掘工具介绍
Ø R语言的优势
Ø R数据挖掘可视化工具-Rattle**上手
Ø R语言对复杂数据可视化的优势
Ø R语言**入门
Ø 利用caret包做数据抽样及虚拟化处理
第1天
下午
数据处理及复杂数据可视化(二)
第二讲 数据质量分析及高级可视化
Ø 缺失值处理的高级方法
Ø 异常值甄别的高级方法
Ø 数据可视化进阶:lattice及ggplot2包介绍
Ø 数据交互可视化:rCharts、recharts、networkD3、plotly等包介绍
第二天
上午
数据挖掘模型实战(一)
第三讲 聚类分析及R语言实现
聚类分析是一种原理简单、应用广泛的数据挖掘技术。顾名思义,聚类分析即是把若干事物按照某种标准归为几个类别,其中较为相近的聚为一类,不那么相近的聚于不同类。
Ø 案例一:对著名的鸢尾花数据进行K均值聚类分析
Ø 案例二:对汽车数据进行K均值聚类分析
Ø 案例三:对洛杉矶街区数据进行层次聚类
Ø 案例四:对汽车数据进行层次聚类
第四讲 关联规则及R语言实现
关联规则(著名的“啤酒和尿布”)是数据挖掘的基础和核心技术之一,本讲将着重围绕经典的Apriori算法,阐明关联规则的支持、置信和提升程度与控制,使用R语言**完成关联规则分析,并经过arulesViz扩展包对关联规则进行可视化展示。
案例:利用超市购物篮Groceries数据进行关联规则分析
第二天
下午
数据挖掘模型实战(二)
第五讲 KNN近邻算法及R语言实现
KNN(k-Nearest Neighbor)分类算法是数据挖掘分类技术中较简单的方法之一。所谓k近邻,就是k个近的邻居的意思,说的是每个样本都可以用它接近的k个邻居来代表。
Ø 案例一:对鸢尾花数据集进行knn分类
Ø 案例二:对乳腺癌数据进行knn分类
Ø 案例三:对文本数据进行knn分类
第六讲 决策树分类及R语言实现
决策树是数据挖掘的经典方法,其原理容易被理解。本讲主要讲授两种为普遍的决策树算法:CART和C5.0算法,使用rpart和C50函数进行R语言分析。
Ø 案例一:对鸢尾花数据集运用C50算法分类
Ø 案例二:对鸢尾花数据集运用CART算法进行分类
Ø 案例三:对汽车数据运用CART对汽车重量进行预测
第三天
上午
行业应用案例分享(一)
第七讲 深度挖掘用户付费行为及社会网络分析
Ø 对用户的购买行为进行购物篮分析
Ø 智能推荐系统常用算法介绍
Ø 对用户购物行为构建智能推荐系统
Ø 社会网络图基本知识
Ø 利用R语言绘制社会网络图
Ø 利用Gephi绘制社会网络图
Ø 对用户购物行为进行聚类分析,发现社群
第三天
下午
行业应用案例分享(二)
第八讲 航空公司客户价值分析
Ø 背景与挖掘目标
Ø 分析方法及过程
Ø 数据探索分析
Ø 数据预处理
Ø 模型构建
Ø 模型应用
第九讲 漏斗模型及路径分析
Ø 漏斗模型的主要应用场景
Ø 路径分析的主要应用场景
Ø 漏斗模型与路径分析的不同点
Ø sunburst事件路径图的绘制方法
Ø 利用基于时序的关联规则对点击事件进行分析
第四天
学习考核与业内经验交流
四、授课师资
谢老师 计算机硕士,数据分析与可视化专家,高级培训讲师。中国R语言资深顾问,WOT“互联网 ”大数据技术、百城沙龙大数据沙龙广深两地特邀顾问。目前就职于某集团上市公司的高级数据分析师,主要利用R语言进行大数据的挖掘和可视化工作。本人从事数据挖掘建模工作已有8年,曾经从事过咨询、电商、电购、电力、游戏等行业,了解不同领域的数据特点。有丰富的利用R语言进行数据挖掘实战经验,部分研究成果曾获得国家专利。培训过的精品课程有:《R语言基础培训》、《Rattle:可视化数据挖掘工具》、《数据分析之R语言实战》、《机器学习与R语言实践》、《R语言与文本挖掘》
钟老师 现任职于中科院某研究所,高级工程师,副高职称,博士毕业于中国科学院计算技术研究所,获工学博士学位(计算机系统结构方向)。中培教育的大数据、云计算、移动互联网系列课程建设与教学专家。近七年来带领团队主要从事大数据与云计算技术项目的研发与IT项目管理工作。钟老师有着多年的企业内训和公开课培训讲师经历,主讲大数据平台技术、云计算、移动互联网、电子商务、IT信息软件项目管理、企业信息化规划与管理、IT战略规划与企业架构、数据中心主机规划与IDC系统运营等企业实战类培训课程。
五、培训费用
面授班培训费5800 元/人(含场地费、考试证书费、教材费、学习期间的午餐费) 食宿统一安排,费用自理。请学员带二寸彩照1张(背面注明姓名),身份证复印件一张;
本课程学习考核考过后由中国信息化培训中心颁发《大数据开发高级架构师》证书,证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。
北京中培伟业管理咨询有限公司(以下简称“中培”)成立于2006年,其主营业务面向大中型企业的IT规划咨询业务和面向高端IT人才的培训类业务,其中咨询业务涉及大型集团化企业的IT战略规划、IT架构规划、IT综合管控等领域,培训业务涉及线上线下各种高级IT技术和管理类课程体系。
与此同时,中培以“为国家培养高阶信息化管理人才”的价值观为使命,以“专业、真诚、执着、创新”的服务理念为指引,不断朝着促进中国企业的信息化综合竞争力与国际影响力提升的目标而前行。
借助于其优质的专家资源池和互联网平台,中培已经为众多的世界500强企业、国有大中型集团化企业、国际知名互联网企业提供过高质量的信息化战略规划、组织架构规划、科技人才管理、信息技术架构规划、信息系统开发和运维管理、信息化能力评测的相关咨询与培训服务。
企业内训与咨询:针对不同的企业需求,每年至少100次以上。
中培使命——助力中国CIO与培训IT精英群体
中培宗旨——以需求为导向、以质量促发展
中培目标——打造中国权威的IT咨询与培训机构
中培优势——权威的专家团队;专业的服务理念;领先的行业优势;前沿的技术;强大的政府支撑。
学校名称:北京中培教育
固定电话:010-64707530
授课地址:丰台区夏家胡同育芳园 预约参观