大數(shù)據(jù)處理高級(jí)工程師 實(shí)戰(zhàn)培訓(xùn)其它上課時(shí)間:
培訓(xùn)對(duì)象:
各地政府云計(jì)算物聯(lián)網(wǎng)產(chǎn)業(yè)相關(guān)負(fù)責(zé)人,各企業(yè)CIO、信息中心負(fù)責(zé)人、技術(shù)總監(jiān),云計(jì)算中心負(fù)責(zé)人,云計(jì)算產(chǎn)業(yè)投資團(tuán)隊(duì),云計(jì)算應(yīng)用開發(fā)商,云計(jì)算硬件設(shè)備供應(yīng)商,云服務(wù)提供商,高校、科研院所云計(jì)算項(xiàng)目負(fù)責(zé)人。各企業(yè)大數(shù)據(jù)架構(gòu)師、技術(shù)總監(jiān)、數(shù)據(jù)挖掘負(fù)責(zé)人、數(shù)據(jù)挖掘開發(fā)工程師
培訓(xùn)內(nèi)容:
課程收益:
1、了解Hadoop的歷史及目前發(fā)展的現(xiàn)狀、以及Hadoop的技術(shù)特點(diǎn),從而把握分布式計(jì)算框架及未來發(fā)展方向,在大數(shù)據(jù)時(shí)代能為企業(yè)的技術(shù)選型及架構(gòu)設(shè)計(jì)提供決策參考。
2、全面掌握Hadoop的架構(gòu)原理和使用場(chǎng)景,并通過貫穿課程的項(xiàng)目進(jìn)行實(shí)戰(zhàn)鍛煉,從而熟練使用Hadoop進(jìn)行MapReduce程序開發(fā)。課程還涵蓋了分布式計(jì)算領(lǐng)域的常用算法介紹,幫助學(xué)員為企業(yè)在利用大數(shù)據(jù)方面體現(xiàn)自身價(jià)值。
3、深入理解Hadoop技術(shù)架構(gòu),對(duì)Hadoop運(yùn)作機(jī)制有清晰全面的認(rèn)識(shí),可以獨(dú)立規(guī)劃及部署生產(chǎn)環(huán)境的Hadoop集群,掌握Hadoop基本運(yùn)維思路和方法,對(duì)Hadoop集群進(jìn)行管理和優(yōu)化。 培訓(xùn)頒發(fā)證書:
參加相關(guān)培訓(xùn)并通過考試的學(xué)員,可以獲得:
工業(yè)和信息化部頒發(fā)的-大數(shù)據(jù)處理高級(jí)工程師。該證書可作為專業(yè)技術(shù)人員職業(yè)能力考核的證明,以及專業(yè)技術(shù)人員崗位聘用、任職、定級(jí)和晉升職務(wù)的重要依據(jù)。
注:請(qǐng)學(xué)員帶一寸彩照2張(背面注明姓名)、身份證復(fù)印件一張。 課程大綱:
模塊一Hadoop在云計(jì)算技術(shù)的作用和地位
傳統(tǒng)大規(guī)模系統(tǒng)存在的問題
Hadoop概述
Hadoop分布式文件系統(tǒng)
MapReduce工作原理
Hadoop集群剖析
Hadoop生態(tài)系統(tǒng)對(duì)一種新的解決方案的需求
Hadoop的行業(yè)應(yīng)用案例分析
Hadoop在云計(jì)算和大數(shù)據(jù)的位置和關(guān)系
數(shù)據(jù)開放,數(shù)據(jù)云服務(wù)平臺(tái)(DAAS)時(shí)代
Hadoop平臺(tái)在數(shù)據(jù)云平臺(tái)(DAAS)上的天然優(yōu)勢(shì)
數(shù)據(jù)云平臺(tái)(DAAS 平臺(tái))組成部分
互聯(lián)網(wǎng)公共數(shù)據(jù)大云(DAAS)案例
Hadoop構(gòu)建構(gòu)建游戲云(Web Game Daas)平臺(tái)
模塊二Hadoop生態(tài)系統(tǒng)介紹和演示
Hadoop HDFS 和 MapReduce
Hadoop數(shù)據(jù)庫之H
Hadoop數(shù)據(jù)倉(cāng)庫之Hive
Hadoop數(shù)據(jù)處理腳本Pig
Hadoop數(shù)據(jù)接口Sqoop和Flume,Scribe DataX
Hadoop工作流引擎 Oozie
運(yùn)用Hadoop自下而上構(gòu)建大規(guī)模企業(yè)數(shù)據(jù)倉(cāng)庫
暴風(fēng)影音數(shù)據(jù)倉(cāng)庫實(shí)戰(zhàn)解析
模塊三Hadoop組件詳解
Hadoop HDFS 基本結(jié)構(gòu)
Hadoop HDFS 副本存放策略
Hadoop NameNode 詳解
HadoopSecondaryNameNode 詳解
Hadoop DataNode 詳解
Hadoop JobTracker 詳解
Hadoop TaskTracker 詳解
Hadoop Mapper類核心代碼
Hadoop Reduce類核心代碼
Hadoop 核心代碼
模塊四Hadoop安裝和部署
Hadoop系統(tǒng)模塊組件概述
Hadoop試驗(yàn)集群的部署結(jié)構(gòu)
Hadoop 安裝依賴關(guān)系
Hadoop 生產(chǎn)環(huán)境的部署結(jié)構(gòu)
Hadoop集群部署
Hadoop 高可用配置方法
Hadoop 集群簡(jiǎn)單測(cè)試方法
Hadoop 集群異常Debug方法
Hadoop安裝部署實(shí)驗(yàn)
Red hat Linux基礎(chǔ)環(huán)境搭建
Hadoop 單機(jī)系統(tǒng)版本安裝配置
Hadoop 集群系統(tǒng)版本安裝和啟動(dòng)配置
使用 Hadoop MapReduce Streaming 快速測(cè)試系統(tǒng)
Hadoopcore-site,hdfs-site,mapred-site 配置詳解
模塊五Hadoop集群規(guī)劃
Hadoop 集群內(nèi)存要求
Hadoop集群磁盤分區(qū)
集群和網(wǎng)絡(luò)拓?fù)湟?br /> 集群軟件的端口配置
針對(duì)NameNode Jobtracker DataNode TaskTracker Hiveserver 等不同組件需求推薦服務(wù)器配置
模塊六MapReduce 算法原理
Hadoop MapReduce 算法的原理和優(yōu)化思想
靈活運(yùn)用MapReduce 實(shí)現(xiàn)算法
運(yùn)用MapReduce 構(gòu)建數(shù)據(jù)庫算法
Select Sort GrougBy Sum Count
Join 新進(jìn)流失算法
使用 Y-Smart 快速轉(zhuǎn)換SQL 為MapReduce 代碼
模塊七編寫MapReduce高級(jí)程序
使用 Hadoop MapReduce Streaming 編程
MapReduce流程
剖析一個(gè)MapReduce程序
基本MapReduceAPI概念
驅(qū)動(dòng)代碼 Mapper、Reducer
Hadoop流
API 使用Eclipse進(jìn)行快速開發(fā)
新MapReduce API
MapReduce的優(yōu)化
MapReduce的任務(wù)調(diào)度
MapReduce編程實(shí)戰(zhàn)
如何利用其他Hadoop相關(guān)技術(shù),包括Apache Hive, Apache Pig,Sqoop和Oozie等
滿足解決實(shí)際數(shù)據(jù)分析問題的高級(jí)Hadoop API
Hadoop Streaming 和 Java MapReduce Api 差異。
MapReduce 實(shí)現(xiàn)數(shù)據(jù)庫功能
利用Combiners來減少中間數(shù)據(jù)
編寫Partitioner來優(yōu)化負(fù)載平衡
直接訪問Hadoop分布式文件系統(tǒng)(HDFS)
Hadoop的join操作
輔助排序在Reducer方的合并
定制Writables和WritableComparables
使用SequenceFiles和Avro文件保存二進(jìn)制數(shù)據(jù)
創(chuàng)建InputFormats OutputFormats
Hadoop的二次排序
Hadoop的海量日志分析
在Map方的合并
模塊八集成Hadoop到現(xiàn)有工作流及Hadoop API深入探討
存儲(chǔ)系統(tǒng)
利用Sqoop從關(guān)系型數(shù)據(jù)庫系統(tǒng)中導(dǎo)入數(shù)據(jù)到Hadoop
利用Flume導(dǎo)入實(shí)時(shí)數(shù)據(jù)到Hadoop
ToolRunner介紹、使用MRUnit進(jìn)行測(cè)試
使用Configure和Close方法來進(jìn)行Map/Reduce設(shè)置和關(guān)閉
使用FuseDFS和Hadoop訪問HDFS
使用分布式緩存(Distributed Cache)
直接訪問Hadoop分布式文件系統(tǒng)(HDFS)
利用Combiners來減少中間數(shù)據(jù)
編寫Partitioner來優(yōu)化負(fù)載平衡
模塊九使用Hive和Pig開發(fā)及技巧
Hive和Pig基礎(chǔ)
Hive的作用和原理說明
Hadoop倉(cāng)庫和傳統(tǒng)數(shù)據(jù)倉(cāng)庫的協(xié)作關(guān)系
Hadoop/Hive倉(cāng)庫數(shù)據(jù)數(shù)據(jù)流
Hive 部署和安裝
Hive Cli 的基本用法
HQL基本語法
運(yùn)用Pig 過濾用戶數(shù)據(jù)
使用JDBC 連接Hive進(jìn)行查詢和分析
使用正則表達(dá)式加載數(shù)據(jù)
HQL高級(jí)語法
編寫UDF函數(shù)
編寫UDAF自定義函數(shù)
基于Hive腳本內(nèi)嵌Streaming 編程
模塊十H安裝和使用
H 安裝部署
H原理和結(jié)構(gòu)
H 運(yùn)維和管理
使用H Hive 提供 OLAP SQL查詢能力
使用H Phoenix提供 OLTP SQL能力
基于H 的時(shí)間序列數(shù)據(jù)庫 OpenTsDb 結(jié)構(gòu)解析
模塊十一Hadoop2.0 集群探索
Hadoop2.0 HDFS 原理
Hadoop2.0 Yarn 原理
Hadoop2.0 生態(tài)系統(tǒng)
基于Hadoop2.0 構(gòu)建分布式系統(tǒng)
模塊十二Hadoop企業(yè)級(jí)別案例解析
Hadoop 結(jié)構(gòu)化數(shù)據(jù)案例
Hadoop 非結(jié)構(gòu)化案例
H 數(shù)據(jù)庫案例
Hadoop 視頻分析案例
利用大數(shù)據(jù)分析改進(jìn)交通管理
區(qū)域醫(yī)療大數(shù)據(jù)應(yīng)用案例
銀聯(lián)大數(shù)據(jù)數(shù)據(jù)票據(jù)詳單平臺(tái)
廣東移動(dòng)省公司請(qǐng)賬單系統(tǒng)
上海電信網(wǎng)絡(luò)優(yōu)化
某通信運(yùn)營(yíng)商全國(guó)用戶上網(wǎng)記錄
浙江臺(tái)州市智能交通系統(tǒng)
移動(dòng)廣州詳單實(shí)時(shí)查詢系統(tǒng)
跨區(qū)域?qū)崟r(shí)視頻監(jiān)控系統(tǒng)
模塊十三RedHadoop 企業(yè)版本
運(yùn)用RedHadoop快速構(gòu)建服務(wù)集群
運(yùn)用RedHadoop DW 構(gòu)建數(shù)據(jù)倉(cāng)庫
基于RedHadoop Hive構(gòu)建數(shù)據(jù)倉(cāng)庫平臺(tái)
靈活運(yùn)用 Hive 加速游戲數(shù)據(jù)倉(cāng)庫
基于Pig OpenCV大規(guī)模圖像人臉識(shí)別
模塊十四Spark原理和入門
Spark原理;Spark的架構(gòu)圖;Spark運(yùn)行模式介紹
—local;—standalone;—messos;—yarn;Spark的RDD
什么是RDD;RDD的種類;—Tranformation;—Action
Spark的存儲(chǔ)級(jí)別;Cache介紹;Spark的容錯(cuò)原理
Lineage容錯(cuò);Checkpoint容錯(cuò);RDD的創(chuàng)建
案例—統(tǒng)計(jì)單詞的個(gè)數(shù) 培訓(xùn)師介紹:
張老師:阿里大數(shù)據(jù)高級(jí)專家,國(guó)內(nèi)資深的Spark、Hadoop技術(shù)專家、虛擬化專家,對(duì)HDFS、MapReduce、H、Hive、Mahout、Storm、spark和openTSDB等Hadoop生態(tài)系統(tǒng)中的技術(shù)進(jìn)行了多年的深入的研究,更主要的是這些技術(shù)在大量的實(shí)際項(xiàng)目中得到廣泛的應(yīng)用,因此在Hadoop開發(fā)和運(yùn)維方面積累了豐富的項(xiàng)目實(shí)施經(jīng)驗(yàn)。近年主要典型的項(xiàng)目有:某電信集團(tuán)網(wǎng)絡(luò)優(yōu)化、中國(guó)移動(dòng)某省移動(dòng)公司請(qǐng)賬單系統(tǒng)和某省移動(dòng)詳單實(shí)時(shí)查詢系統(tǒng)、中國(guó)銀聯(lián)大數(shù)據(jù)數(shù)據(jù)票據(jù)詳單平臺(tái)、某大型銀行大數(shù)據(jù)記錄系統(tǒng)、某大型通信運(yùn)營(yíng)商全國(guó)用戶上網(wǎng)記錄、某省交通部門違章系統(tǒng)、某區(qū)域醫(yī)療大數(shù)據(jù)應(yīng)用項(xiàng)目、互聯(lián)網(wǎng)公共數(shù)據(jù)大云(DAAS)和構(gòu)建游戲云(Web Game Daas)平臺(tái)項(xiàng)目等。