面授班培訓(xùn)費5800 元/人(含場地費、考試證書費、教材費、學(xué)習(xí)期間的午餐費) 食宿統(tǒng)一安排,費用自理。 本課程學(xué)習(xí)考核通過后頒發(fā)《大數(shù)據(jù)開發(fā)高級架構(gòu)師》證書, 證書可作為專業(yè)技術(shù)人員職業(yè)能力考核的證明,以及專業(yè)技術(shù)人員崗位聘用、任職、定級和晉升職務(wù)的重要依據(jù)。
1. 本課程盡量避開數(shù)學(xué)公式,按照“講清思想方法原理—結(jié)合具體案例—R語言實現(xiàn)細(xì)節(jié)”思路,讓即使是幾乎沒有什么基礎(chǔ)的學(xué)員,掌握數(shù)據(jù)挖掘和可視化的基本思路和模式,打下未來深入的良好基礎(chǔ),能在工作和學(xué)習(xí)中結(jié)合具體問題立馬上手操作解決;
2. 課程注重學(xué)練結(jié)合的方法,會采取課中練習(xí)的方法,充分調(diào)動大家思考的積極性,在做中掌握相關(guān)知識和技能;
3. 課程緊緊抓住基于R語言的數(shù)據(jù)挖掘和可視化的重點和難點,詳細(xì)的分析和講解,在理解難、容易出錯的地方反復(fù)提醒,以便學(xué)員在課后容易的進(jìn)行自己復(fù)習(xí)和相關(guān)拓展。
第一天
上午 數(shù)據(jù)處理及復(fù)雜數(shù)據(jù)可視化(一)
第一講 大數(shù)據(jù)挖掘及可視化介紹
數(shù)據(jù)挖掘及可視化背景
數(shù)據(jù)挖掘流程
常用挖掘工具介紹
R語言的優(yōu)勢
R數(shù)據(jù)挖掘可視化工具-Rattle快速上手
R語言對復(fù)雜數(shù)據(jù)可視化的優(yōu)勢
R語言快速入門
利用caret包做數(shù)據(jù)抽樣及虛擬化處理
第一天
下午 數(shù)據(jù)處理及復(fù)雜數(shù)據(jù)可視化(二)
第二講 數(shù)據(jù)質(zhì)量分析及高級可視化
缺失值處理的高級方法
異常值甄別的高級方法
數(shù)據(jù)可視化進(jìn)階:lattice及ggplot2包介紹
數(shù)據(jù)交互可視化:rCharts、recharts、networkD3、plotly等包介紹
第二天
上午 數(shù)據(jù)挖掘模型實戰(zhàn)(一)
第三講 聚類分析及R語言實現(xiàn)
聚類分析是一種原理簡單、應(yīng)用廣泛的數(shù)據(jù)挖掘技術(shù)。顧名思義,聚類分析即是把若干事物按照某種標(biāo)準(zhǔn)歸為幾個類別,其中較為相近的聚為一類,不那么相近的聚于不同類。
案例一:對著名的鳶尾花數(shù)據(jù)進(jìn)行K均值聚類分析
案例二:對汽車數(shù)據(jù)進(jìn)行K均值聚類分析
案例三:對洛杉磯街區(qū)數(shù)據(jù)進(jìn)行層次聚類
案例四:對汽車數(shù)據(jù)進(jìn)行層次聚類
第四講 關(guān)聯(lián)規(guī)則及R語言實現(xiàn)
關(guān)聯(lián)規(guī)則(著名的“啤酒和尿布”)是數(shù)據(jù)挖掘的基礎(chǔ)和核心技術(shù)之一,本講將著重圍繞經(jīng)典的Apriori算法,闡明關(guān)聯(lián)規(guī)則的支持、置信和提升程度與控制,使用R語言快速完成關(guān)聯(lián)規(guī)則分析,并通過arulesViz擴(kuò)展包對關(guān)聯(lián)規(guī)則進(jìn)行可視化展示。
案例:利用超市購物籃Groceries數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則分析
第二天
下午 數(shù)據(jù)挖掘模型實戰(zhàn)(二)
第五講 KNN近鄰算法及R語言實現(xiàn)
KNN(k-Nearest Neighbor)分類算法是數(shù)據(jù)挖掘分類技術(shù)中較簡單的方法之一。所謂k最近鄰,就是k個最近的鄰居的意思,說的是每個樣本都可以用它最接近的k個鄰居來代表。
案例一:對鳶尾花數(shù)據(jù)集進(jìn)行knn分類
案例二:對乳腺癌數(shù)據(jù)進(jìn)行knn分類
案例三:對文本數(shù)據(jù)進(jìn)行knn分類
第六講 決策樹分類及R語言實現(xiàn)
決策樹是數(shù)據(jù)挖掘的經(jīng)典方法,其原理容易被理解。本講主要講授兩種最為普遍的決策樹算法:CART和C5.0算法,使用rpart和C50函數(shù)進(jìn)行R語言分析。
案例一:對鳶尾花數(shù)據(jù)集運用C50算法分類
案例二:對鳶尾花數(shù)據(jù)集運用CART算法進(jìn)行分類
案例三:對汽車數(shù)據(jù)運用CART對汽車重量進(jìn)行預(yù)測
第三天
上午 行業(yè)應(yīng)用案例分享(一)
第七講 深度挖掘用戶付費行為及社會網(wǎng)絡(luò)分析
對用戶的購買行為進(jìn)行購物籃分析
智能推薦系統(tǒng)常用算法介紹
對用戶購物行為構(gòu)建智能推薦系統(tǒng)
社會網(wǎng)絡(luò)圖基本知識
利用R語言繪制社會網(wǎng)絡(luò)圖
利用Gephi繪制社會網(wǎng)絡(luò)圖
對用戶購物行為進(jìn)行聚類分析,發(fā)現(xiàn)社群
第三天
下午 行業(yè)應(yīng)用案例分享(二)
第八講 航空公司客戶價值分析
背景與挖掘目標(biāo)
分析方法及過程
數(shù)據(jù)探索分析
數(shù)據(jù)預(yù)處理
模型構(gòu)建
模型應(yīng)用
第九講 漏斗模型及路徑分析
漏斗模型的主要應(yīng)用場景
路徑分析的主要應(yīng)用場景
漏斗模型與路徑分析的不同點
sunburst事件路徑圖的繪制方法
利用基于時序的關(guān)聯(lián)規(guī)則對點擊事件進(jìn)行分析
第四天 學(xué)習(xí)考核與業(yè)內(nèi)經(jīng)驗交流
謝老師 計算機(jī)碩士,數(shù)據(jù)分析與可視化專家,高級培訓(xùn)講師。中國R語言資深顧問,WOT“互聯(lián)網(wǎng)+”大數(shù)據(jù)技術(shù)、百城沙龍大數(shù)據(jù)沙龍廣深兩地特邀顧問。目前就職于某集團(tuán)上市公司的高級數(shù)據(jù)分析師,主要利用R語言進(jìn)行大數(shù)據(jù)的挖掘和可視化工作。本人從事數(shù)據(jù)挖掘建模工作已有8年,曾經(jīng)從事過咨詢、電商、電購、電力、游戲等行業(yè),了解不同領(lǐng)域的數(shù)據(jù)特點。有豐富的利用R語言進(jìn)行數(shù)據(jù)挖掘?qū)崙?zhàn)經(jīng)驗,部分研究成果曾獲得國家專利。培訓(xùn)過的精品課程有:《R語言基礎(chǔ)培訓(xùn)》、《Rattle:可視化數(shù)據(jù)挖掘工具》、《數(shù)據(jù)分析之R語言實戰(zhàn)》、《機(jī)器學(xué)習(xí)與R語言實踐》、《R語言與文本挖掘》
鐘老師 現(xiàn)任職于中科院某研究所,高級工程師,副高職稱,博士畢業(yè)于中國科學(xué)院計算技術(shù)研究所,獲工學(xué)博士學(xué)位(計算機(jī)系統(tǒng)結(jié)構(gòu)方向)。中培教育的大數(shù)據(jù)、云計算、移動互聯(lián)網(wǎng)系列課程建設(shè)與教學(xué)專家。近七年來帶領(lǐng)團(tuán)隊主要從事大數(shù)據(jù)與云計算技術(shù)項目的研發(fā)與IT項目管理工作。鐘老師有著多年的企業(yè)內(nèi)訓(xùn)和公開課培訓(xùn)講師經(jīng)歷,主講大數(shù)據(jù)平臺技術(shù)、云計算、移動互聯(lián)網(wǎng)、電子商務(wù)、IT信息軟件項目管理、企業(yè)信息化規(guī)劃與管理、IT戰(zhàn)略規(guī)劃與企業(yè)架構(gòu)、數(shù)據(jù)中心主機(jī)規(guī)劃與IDC系統(tǒng)運營等企業(yè)實戰(zhàn)類培訓(xùn)課程。