大数据前沿技术分析与应用培训(北京,5月24-26日)

所属课程分类: 管理研修 » 企业管理 (加入收藏)
上课地点: 电话咨询上海 
报名截止日期: 2017/5/24
授课方式: 面授  |  班型: 全日制
课程评分: (我要点评)

课程价格: 5800
咨询电话: 010-56028090 13810210257
分享到:

人气指数:

大数据前沿技术分析与应用培训(北京,5月24-26日)

【举办单位】北京曼顿培训网  www.mdpxb.com  中国培训资讯网  www.e71edu.com

【咨询电话】4006820825  010-56133998  13810210257  

【培训日期】上海,2017年4月17-19日;北京,2017年5月24-26日

【培训地点】上海、北京

【培训对象】

1,系统架构师、系统分析师、高级程序员、资深开发人员。

2,牵涉到数据挖掘和统计分析的数据中心运行、规划、设计负责人。

3,政府机关,金融保险、移动和互联网等大数据来源单位的负责人。

4,高校、科研院所牵涉到数据挖掘与统计分析处理的项目负责人。


【课程背景】

随着互联网、移动互联网和物联网的发展,我们已经切实地迎来了一个大数据的时代。如何对海量数据进行挖掘和分析,已经成为一个非常重要且紧迫的需求。

从2008年Natural正式定义“大数据”开始,以Hadoop为代表的大数据处理和分析工具,以其可伸缩性、健壮性、计算性能和成本上具有无可替代的优势,事实上已成为当前互联网企业主流数据分析平台。大数据相关技术最近几年出现了井喷的趋势,众多技术纷纷出现,典型的系统包括Hadoop、Spark、Flume、Scribe、Kafka、Storm、Mahout、MLlib、Docker等,涵盖网络数据爬取、日志采集、分布式消息订阅、大数据分析挖掘等方面,涉及离线批处理、实时处理、流式处理等多种处理方式。这些技术来源于国外不同的著名大公司和科研院校(例如Storm源自Twitter,Spark源自UC Berkley),且大都以开源方式公开,用于解决不同的应用需求,涉及面广,技术要求高,交叉知识范围广,知识内容更新频繁,要理清其中的关系,从中发现最适合本机构的技术,成为了目前各机构技术专家的一个难点。



【培训目标】

1、全面了解大数据前沿技术的相关知识。

2、学习大数据前沿技术平台、方法以及应用特征。

3、学习使用大数据挖掘和分析中的使用。 

4、了解Hadoop、Spark等技术的融合使用。


【课程大纲】

第一讲 大数据技术基础

  1)大数据应用需求及潜在价值分析

  2)大数据与数据库解决方案的对比

  3)国内外主流的大数据解决方案

  4)开源的大数据生态系统平台剖析

  5)大数据下的技术选型与架构设计

第二讲 批处理大数据平台Hadoop

  1)Hadoop及其运行架构

  2)HDFS分布式文件系统

  3)MapReduce计算模型

  4)HBase大表管理技术

  5)Hadoop平台使用和实操

第三讲 实时大数据平台Spark

1)Spark实时处理技术

2)弹性分布式数据集RDD 

  3)Spark分布式计算框架

  4)Spark的BDAS生态系统

  5)Spark平台使用和实操

第四讲 流式大数据平台Storm

  1)流式大数据处理架构

  2)Storm在企业应用介绍

  3)Storm拓扑及流分组

  4)Spout和Bolt详解

  5)分布式DPRC和Trident

6)Storm平台使用和实操

第五讲 Python网络爬虫

  1)网络爬虫基础

  2)urllib和urllib2库的用法

  3)Python 正则表达式

  4)Beautiful Soup使用

  5)用Scrapy采集示例实操

第六讲 大数据日志采集工具Flume

  1)日志采集及Scribe介绍

2)Flume-NG数据流模型

  3)Flume平台架构

  4)Flume集群部署配置

  5)Flume应用案例实操

第七讲 分布式消息订阅工具Kafka

  1)Kafka应用介绍

  2)Kafka平台架构

  3)Kafka集群部署与配置

  4)Kafka应用案例实操

第八讲 NoSQL云数据处理工具

   1)NoSQL技术及云数据库介绍

   2)HBase列数据存储及处理机制

   3)HBase高并发读/写实现及案例

   4)MongoDB文档数据存储及处理

   5)MongoDB操作实现及案例

第九讲 大数据中的SQL工具

   1)大数据中的类SQL工具

   2) Hive设计目标和数据模型

   3) Hive关键性技术和案例

   4) SparkSQL设计目标和数据模型

   5) SparkSQL关键性技术和案例

第十讲 大数据分析挖掘工具

  1)大数据挖掘及知识模型的发现

  2)大数据挖掘工具Mahout和MLlib

  3)推荐方法及MLlib电影推荐案例

  4)分类方法及Mahout新闻分类案例

  5)聚类方法及K-Means聚类案例

第十一讲 资源虚拟化工具Docker

  1)虚拟化和容器技术

  2)LXC和Docker的发展

  3)Docker架构及特性

  4)镜像、容器和仓库

  5)Docker的执行及其案例实操

第十二讲 大数据技术展望

  1)大数据分析技术展望

  2)大数据平台的发展展望

  3)大数据挖掘的应用展望


【讲师介绍】

   杨老师,曼顿培训网(www.mdpxb.com)资深讲师。主要研究网络信息分析以及云计算相关技术,长期从事通信网管系统、网络信息处理、商务智能(BI)以及电信决策支持系统的研究开发工作,主持和参与了多个国家和省部级基金项目,具有丰富的工程实践及软件研发经验。


【费用及报名】

1、费用:培训费5800元(含培训费、讲义费);如需食宿,会务组可统一安排,费用自理。

2、报名咨询:4006820825  010-56133998  56028090  13810210257   鲍老师

3、报名流程:电话登记-->填写报名表-->发出培训确认函

4、备注:如课程已过期,请访问我们的网站,查询最新课程

5、详细资料请访问北京曼顿培训网:www.mdpxb.com (每月在全国开设四百多门公开课,欢迎报名学习)



第二个标签的内容
预定该课程 (填写真实的详细学习需求信息,有助于学校更针对的帮您选择合适的课程)
电话咨询上海
闸北区公园附近