大數(shù)據(jù)Hadoop與Spark技術(shù)架構(gòu)與應(yīng)用實(shí)戰(zhàn) 培訓(xùn)班的通知其它上課時(shí)間:
培訓(xùn)對(duì)象:
1.大數(shù)據(jù)Hadoop與Spark技術(shù)的應(yīng)用開(kāi)發(fā)工程師2.大數(shù)據(jù)分析與挖掘工程師3.大數(shù)據(jù)集群運(yùn)維工程師4.大數(shù)據(jù)項(xiàng)目的IT管理人員5.大數(shù)據(jù)項(xiàng)目規(guī)劃的咨詢?nèi)藛T6.對(duì)Hadoop與Spark大數(shù)據(jù)技術(shù)感興趣的愛(ài)好者7.打算上線大數(shù)據(jù)項(xiàng)目及具有大數(shù)據(jù)應(yīng)用需求的各行業(yè)的企業(yè)信息化技術(shù)與管理人員8.具備一定的Java和Linux基礎(chǔ)的尤佳。
培訓(xùn)內(nèi)容:
課程收益:
1.深刻理解在“互聯(lián)網(wǎng) ”時(shí)代下大數(shù)據(jù)的產(chǎn)生背景、發(fā)展歷程和演化趨勢(shì),洞察大數(shù)據(jù)的潛在價(jià)值,結(jié)合業(yè)界市場(chǎng)需求和國(guó)內(nèi)外最新的大數(shù)據(jù)技術(shù)潮流,掌握大數(shù)據(jù)項(xiàng)目解決方案以及業(yè)界大數(shù)據(jù)應(yīng)用案例,從而為企業(yè)在大數(shù)據(jù)項(xiàng)目中的技術(shù)選型及技術(shù)架構(gòu)設(shè)計(jì)提供決策參考,幫助學(xué)員為企業(yè)在利用大數(shù)據(jù)方面體現(xiàn)出自身價(jià)值。
2.全面掌握業(yè)界最流行的Hadoop與Spark大數(shù)據(jù)技術(shù)體系,掌握包括大數(shù)據(jù)采集技術(shù)、大數(shù)據(jù)分布式存儲(chǔ)技術(shù)、NoSQL與NewSQL分布式數(shù)據(jù)庫(kù)技術(shù)、大數(shù)據(jù)倉(cāng)庫(kù)與統(tǒng)計(jì)機(jī)器學(xué)習(xí)技術(shù)、大數(shù)據(jù)分析挖掘與商業(yè)智能(BI)技術(shù)、大數(shù)據(jù)離線處理技術(shù)、Storm流式大數(shù)據(jù)處理技術(shù)、基于內(nèi)存計(jì)算的大數(shù)據(jù)實(shí)時(shí)處理技術(shù),以及大數(shù)據(jù)管理技術(shù)的原理知識(shí)和應(yīng)用實(shí)戰(zhàn)。
3.深入理解大數(shù)據(jù)平臺(tái)技術(shù)架構(gòu)和使用場(chǎng)景,能嫻熟地運(yùn)用Hadoop與Spark大數(shù)據(jù)技術(shù)體系規(guī)劃解決方案滿足實(shí)際項(xiàng)目需求,部署符合生產(chǎn)環(huán)境要求的Hadoop大數(shù)據(jù)集群,熟練地掌握基于Hadoop與Spark大數(shù)據(jù)平臺(tái)進(jìn)行應(yīng)用程序開(kāi)發(fā)、集群運(yùn)維管理和性能調(diào)優(yōu)技巧,并通過(guò)具體的實(shí)訓(xùn)項(xiàng)目貫穿整個(gè)課程進(jìn)行實(shí)戰(zhàn)鍛煉。 培訓(xùn)頒發(fā)證書(shū):
本課程頒發(fā)證書(shū),證書(shū)查詢: www.zpedu.org (中國(guó)信息化培訓(xùn)中心)
中國(guó)信息化培訓(xùn)中心頒發(fā)的《大數(shù)據(jù)開(kāi)發(fā)高級(jí)架構(gòu)師》證書(shū)。
證書(shū)可作為專業(yè)技術(shù)人員職業(yè)能力考核的證明,以及專業(yè)技術(shù)人員崗位聘用、任職、定級(jí)和晉升職務(wù)的重要依據(jù)。 課程大綱:
第一天上午
一、大數(shù)據(jù)技術(shù)基礎(chǔ)入門
1.大數(shù)據(jù)的產(chǎn)生背景、發(fā)展歷程
2.大數(shù)據(jù)和云計(jì)算的關(guān)系
3.大數(shù)據(jù)應(yīng)用需求以及潛在價(jià)值分析
4.業(yè)界最新的大數(shù)據(jù)技術(shù)發(fā)展態(tài)勢(shì)與應(yīng)用趨勢(shì)
5.大數(shù)據(jù)項(xiàng)目的技術(shù)選型與架構(gòu)設(shè)計(jì)
6.“互聯(lián)網(wǎng) ”時(shí)代下的電子商務(wù)、制造業(yè)、零售批發(fā)業(yè)、電信運(yùn)營(yíng)商、互聯(lián)網(wǎng)金融業(yè)、網(wǎng)上銀行、電子政務(wù)、移動(dòng)互聯(lián)網(wǎng)、教育信息化等行業(yè)應(yīng)用實(shí)踐與應(yīng)用案例剖析
二、業(yè)界主流的大數(shù)據(jù)技術(shù)產(chǎn)品與項(xiàng)目解決方案
7.國(guó)內(nèi)外主流的大數(shù)據(jù)解決方案介紹
8.當(dāng)前大數(shù)據(jù)解決方案與傳統(tǒng)數(shù)據(jù)庫(kù)方案的剖析比較
9.Apache大數(shù)據(jù)平臺(tái)方案剖析
10.CDH大數(shù)據(jù)平臺(tái)方案剖析
11.HDP大數(shù)據(jù)平臺(tái)方案剖析
12.開(kāi)源的大數(shù)據(jù)生態(tài)系統(tǒng)平臺(tái)剖析
三、Hadoop與Spark大數(shù)據(jù)處理平臺(tái)
13.Hadoop的發(fā)展歷程以及產(chǎn)業(yè)界的實(shí)際應(yīng)用介紹
14.Hadoop大數(shù)據(jù)平臺(tái)架構(gòu),以及PB級(jí)大數(shù)據(jù)處理工作原理與機(jī)制
15.Hadoop的核心組件剖析
16.Spark的發(fā)展歷程以及業(yè)界的實(shí)際應(yīng)用介紹
17.Spark實(shí)時(shí)大數(shù)據(jù)處理平臺(tái)架構(gòu),以及內(nèi)存大數(shù)據(jù)處理工作原理與機(jī)制
18.Spark的核心組件剖析
第一天下午
四、大數(shù)據(jù)采集與分布式消息訂閱系統(tǒng)
19.Flume-NG數(shù)據(jù)采集系統(tǒng)的數(shù)據(jù)流模型、平臺(tái)架構(gòu)、集群部署與配置應(yīng)用實(shí)戰(zhàn)
20.Kafka分布式消息訂閱系統(tǒng)的應(yīng)用介紹、平臺(tái)架構(gòu)、集群部署與配置應(yīng)用實(shí)戰(zhàn)
21.Scribe分布式日志收集系統(tǒng)的簡(jiǎn)介、工作原理、平臺(tái)架構(gòu)、集群部署與配置應(yīng)用實(shí)戰(zhàn)
22.ZooKeeper分布式協(xié)調(diào)服務(wù)系統(tǒng)的工作原理、平臺(tái)架構(gòu)、集群部署與配置應(yīng)用實(shí)戰(zhàn)
五、大數(shù)據(jù)分布式存儲(chǔ)系統(tǒng)
23.分布式文件系統(tǒng)HDFS的簡(jiǎn)介
24.HDFS系統(tǒng)的主從式平臺(tái)架構(gòu)和工作原理
25.HDFS核心技術(shù)講解
26.HDFS應(yīng)用開(kāi)發(fā)實(shí)戰(zhàn)
27.HDFS集群的安裝、部署、配置與性能優(yōu)化技巧
28.分布式鍵值存儲(chǔ)系統(tǒng)介紹、平臺(tái)架構(gòu)、核心技術(shù)以及應(yīng)用開(kāi)發(fā)
29.PB及大數(shù)據(jù)存儲(chǔ)系統(tǒng)的項(xiàng)目案例分析
六、大數(shù)據(jù)MapReduce與Yarn并行處理平臺(tái)
30.MapReduce并行計(jì)算模型
31.MapReduce作業(yè)執(zhí)行與調(diào)度技術(shù)
32.第二代大數(shù)據(jù)計(jì)算框架Yarn的工作原理以及DAG并行執(zhí)行機(jī)制
33.MapReduce應(yīng)用開(kāi)發(fā)環(huán)境的部署,以及大數(shù)據(jù)并行處理應(yīng)用程序開(kāi)發(fā)
34.MapReduce高級(jí)編程技巧與性能優(yōu)化實(shí)踐
35.MapReduce與Yarn項(xiàng)目案例實(shí)踐
第二天上午
七、大數(shù)據(jù)Spark實(shí)時(shí)處理平臺(tái)
36.內(nèi)存計(jì)算模型和實(shí)時(shí)處理技術(shù)介紹
37.Spark分布式實(shí)時(shí)處理框架及工作原理
38.Spark集群的平臺(tái)架構(gòu)及其生態(tài)系統(tǒng)組件剖析
39.Spark SQL應(yīng)用實(shí)踐
40.Spark Streaming應(yīng)用實(shí)踐
41.MLib/ML實(shí)時(shí)機(jī)器學(xué)習(xí)應(yīng)用實(shí)踐
42.GraphX實(shí)時(shí)圖數(shù)據(jù)處理應(yīng)用實(shí)踐
43.Spark實(shí)時(shí)處理集群的安裝部署與配置優(yōu)化
44.Spark的編程開(kāi)發(fā)應(yīng)用實(shí)戰(zhàn)
45.Spark與Hadoop的對(duì)接集成解決方案實(shí)踐
八、Storm流式數(shù)據(jù)處理平臺(tái)
46.Storm流式處理系統(tǒng)介紹、平臺(tái)架構(gòu)以及工作原理
47.Storm集群安裝部署與配置優(yōu)化
48.Storm日志分析項(xiàng)目應(yīng)用實(shí)戰(zhàn)
第二天下午
九、H分布式數(shù)據(jù)庫(kù)管理系統(tǒng)
49.NoSQL數(shù)據(jù)庫(kù)與NewSQL數(shù)據(jù)庫(kù)技術(shù)介紹,及其在半結(jié)構(gòu)化和非結(jié)構(gòu)化大數(shù)據(jù)方面的應(yīng)用實(shí)踐
50.H分布式數(shù)據(jù)庫(kù)簡(jiǎn)介、數(shù)據(jù)模型以及工作原理
51.H分布式數(shù)據(jù)庫(kù)集群的平臺(tái)架構(gòu)和關(guān)鍵技術(shù)剖析
52.H應(yīng)用項(xiàng)目開(kāi)發(fā)技巧,以及客戶端開(kāi)發(fā)實(shí)戰(zhàn)
53.H表設(shè)計(jì)與數(shù)據(jù)操作以及數(shù)據(jù)庫(kù)管理API調(diào)用
54.H集群的安裝部署與配置優(yōu)化
55.H集群的運(yùn)維與監(jiān)控管理
十、Cassandra數(shù)據(jù)管理系統(tǒng)
56.Cassandra數(shù)據(jù)存儲(chǔ)管理系統(tǒng)的應(yīng)用介紹
57.Cassandra集群的平臺(tái)架構(gòu)以及核心關(guān)鍵技術(shù)
58.Cassandra一致性哈希算法與數(shù)據(jù)對(duì)象分布策略
59.Cassandra集群的安裝部署與配置優(yōu)化
60.Cassandra應(yīng)用開(kāi)發(fā)實(shí)戰(zhàn)
第三天上午
十一、內(nèi)存數(shù)據(jù)庫(kù)管理系統(tǒng)集群
61.Impala實(shí)時(shí)查詢系統(tǒng)的應(yīng)用介紹
62.Impala實(shí)時(shí)查詢系統(tǒng)平臺(tái)架構(gòu)、核心關(guān)鍵技術(shù)剖析
63.Impala實(shí)時(shí)查詢系統(tǒng)的部署與應(yīng)用開(kāi)發(fā)實(shí)踐
64.Redis內(nèi)存數(shù)據(jù)庫(kù)介紹,以及業(yè)界應(yīng)用案例
65.Redis內(nèi)存數(shù)據(jù)庫(kù)集群架構(gòu)以及核心技術(shù)剖析
66.Redis集群的安裝部署與應(yīng)用開(kāi)發(fā)實(shí)戰(zhàn)
十二、大型數(shù)據(jù)倉(cāng)庫(kù)Hive集群平臺(tái)
67.基于Hadoop的大型分布式數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)知識(shí),以及在行業(yè)中的應(yīng)用實(shí)踐案例
68.基于Spark的實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)集群基礎(chǔ)知識(shí),以及在行業(yè)中的應(yīng)用實(shí)踐案例
69.Hive大數(shù)據(jù)倉(cāng)庫(kù)簡(jiǎn)介以及應(yīng)用介紹
70.Hive數(shù)據(jù)倉(cāng)庫(kù)集群的平臺(tái)體系結(jié)構(gòu)、核心技術(shù)剖析
71.Hive Server工作原理與應(yīng)用技巧
72.Hive數(shù)據(jù)倉(cāng)庫(kù)集群的安裝部署與配置優(yōu)化
73.Hive應(yīng)用開(kāi)發(fā)技巧
74.Hive QL定義以及應(yīng)用
75.Hive數(shù)據(jù)倉(cāng)庫(kù)表與表分區(qū)、表操作、數(shù)據(jù)導(dǎo)入導(dǎo)出、客戶端操作技巧
76.Hive數(shù)據(jù)倉(cāng)庫(kù)報(bào)表設(shè)計(jì)、HWI、CLI客戶端演示以及用戶自定義函數(shù)(UDF)的開(kāi)發(fā)實(shí)踐
第三天下午
十三、Mahout大數(shù)據(jù)分析挖掘平臺(tái)
77.大數(shù)據(jù)分析挖掘技術(shù)介紹,以及行業(yè)大數(shù)據(jù)挖掘應(yīng)用案例
78.Mahout大數(shù)據(jù)挖掘平臺(tái)的體系架構(gòu)、核心算法與關(guān)鍵技術(shù)運(yùn)用
79.基于Mahout的數(shù)據(jù)挖掘應(yīng)用程序開(kāi)發(fā)實(shí)戰(zhàn)
80.Mahout集群的安裝部署與配置優(yōu)化
81.集成Mahout與Hadoop集成大數(shù)據(jù)挖掘平臺(tái)應(yīng)用實(shí)戰(zhàn)
十四、大數(shù)據(jù)智能化ETL操作以及Hadoop集群運(yùn)維監(jiān)控工具平臺(tái)應(yīng)用
82.Hadoop與DBMS之間進(jìn)行數(shù)據(jù)轉(zhuǎn)換的框架
83.Sqoop導(dǎo)入導(dǎo)出數(shù)據(jù)的工作原理,以及Sqoop集群安裝部署與配置
84.Kettle集群的平臺(tái)架構(gòu)、核心技術(shù)工作原理以及應(yīng)用案例
85.Kettle集群安裝部署與配置,以及應(yīng)用開(kāi)發(fā)實(shí)戰(zhàn)
86.利用Sqoop實(shí)現(xiàn)MySQL與Hadoop集群之間的數(shù)據(jù)導(dǎo)入導(dǎo)出交互程序
87.Hadoop大數(shù)據(jù)運(yùn)維監(jiān)控系統(tǒng)HUE平臺(tái)的安裝部署與配置優(yōu)化
十五、大數(shù)據(jù)項(xiàng)目應(yīng)用實(shí)戰(zhàn)
88.根據(jù)布置的實(shí)際應(yīng)用案例,開(kāi)展大數(shù)據(jù)完整項(xiàng)目部署設(shè)計(jì)和應(yīng)用開(kāi)發(fā)實(shí)踐 培訓(xùn)師介紹:
鐘老師 現(xiàn)任職于中科院某研究所,高級(jí)工程師,副高職稱,項(xiàng)目組負(fù)責(zé)人,博士畢業(yè)于中國(guó)科學(xué)院計(jì)算技術(shù)研究所,獲工學(xué)博士學(xué)位(計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)方向)。中培教育的大數(shù)據(jù)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)系列課程建設(shè)與教學(xué)專家。近六年來(lái)帶領(lǐng)團(tuán)隊(duì)主要從事大數(shù)據(jù)與云計(jì)算技術(shù)項(xiàng)目的研發(fā)與IT項(xiàng)目管理工作,主要精通Hadoop平臺(tái)技術(shù),基于內(nèi)存計(jì)算的實(shí)時(shí)處理技術(shù)(Spark),分布式文件系統(tǒng)技術(shù),MapReduce與Yarn分布式并行計(jì)算技術(shù),大數(shù)據(jù)分布式采集技術(shù)(Flume-NG),大數(shù)據(jù)分布式消息系統(tǒng)技術(shù)(Kafka),KVS鍵值存儲(chǔ)系統(tǒng)技術(shù),大數(shù)據(jù)管理與分析處理技術(shù),NoSQL與NewSQL分布式數(shù)據(jù)庫(kù)(H、Cassandra、MongoDB),內(nèi)存數(shù)據(jù)庫(kù)技術(shù)(Redis、Mem/Memcached),大數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)技術(shù)(Mahout),大數(shù)據(jù)倉(cāng)庫(kù)技術(shù)(HIVE),實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)(Shark),大數(shù)據(jù)中心集群監(jiān)控與運(yùn)維(HUE)技術(shù)的實(shí)現(xiàn)細(xì)節(jié)。鐘老師有著多年的企業(yè)內(nèi)訓(xùn)和公開(kāi)課培訓(xùn)講師經(jīng)歷,主要講授大數(shù)據(jù)平臺(tái)技術(shù)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、電子商務(wù)、IT信息軟件項(xiàng)目管理、企業(yè)信息化規(guī)劃與管理、IT戰(zhàn)略規(guī)劃與企業(yè)架構(gòu)、數(shù)據(jù)中心主機(jī)規(guī)劃與IDC系統(tǒng)運(yùn)營(yíng)等企業(yè)實(shí)戰(zhàn)類培訓(xùn)課程。鐘老師將原理技術(shù)剖析和應(yīng)用實(shí)戰(zhàn)相結(jié)合的授課風(fēng)格受到廣大公開(kāi)課學(xué)員和企業(yè)內(nèi)訓(xùn)學(xué)員的歡迎,鐘老師已授課的企業(yè)內(nèi)訓(xùn)客戶包括:中國(guó)人壽總部、中海油信息中心、中國(guó)移動(dòng)總部和若干個(gè)省級(jí)分公司、國(guó)家電網(wǎng)總部以及若干下屬企業(yè)、中石化信息中心、中國(guó)聯(lián)通、中國(guó)郵政、徽商銀行、江蘇南瑞集團(tuán)、北京銀行、燕山石化總部信息部、航天科技某院所、航天科工某院所、中石油總部信息部與若干直屬企業(yè)信息部、中電集團(tuán)某所、瑞中科技等五十余家國(guó)內(nèi)大型國(guó)有企事業(yè)單位和民營(yíng)上市公司。鐘老師還講授過(guò)百余場(chǎng)云計(jì)算、大數(shù)據(jù)與移動(dòng)互聯(lián)網(wǎng)公開(kāi)課培訓(xùn)課程。
蔣德鈞 清華大學(xué)博士,