大數據分析與數據挖掘能力提升實戰
大數據分析與數據挖掘能力提升實戰課程/講師盡在大數據分析與數據挖掘能力提升實戰專題,大數據分析與數據挖掘能力提升實戰公開課北上廣深等地每月開課!大數據分析與數據挖掘能力提升實戰在線直播課程(免費試聽)。專家微信18749492090,講師手機13522550408,百度搜索“交廣國際管理咨詢”了解更多。
【課程大綱】
第一部分:解構大數據
1、 大數據時代已經來臨
2、 大數據的三層理解
? 理論層:以數據為基礎
? 技術層:以平臺為手段
? 應用層:以應用為導向
3、 大數據的4V特征
4、 大數據的核心價值
? 發現業務運行規律
? 預測事物未來
5、 大數據在各行業是如何應用的
? 醫療衛生
? 政治軍事
? 行政執法
? 金融銀行
? ……
6、 數據分析的核心理念
? 數據變化意味著業務變化
? 數據間關系意味著因素間的關系
7、 大數據戰略
? 大數據成為企業的核心資產
? 大數據成為業務創新的核心引擎
? 從數據化運營到運營數據
8、 大數據的思維變革
? 定量思維
? 相關思維
? 實驗思維
? ……
9、 大數據的商業模式分析
10、 大數據的人才培養
第二部分:數據分析篇問題:數據分析是神馬?數據分析基本過程?
1、 數據分析面臨的常見問題
2、 認識數據分析
? 什么是數據分析
? 數據分析的三大作用
? 數據分析的三大類別
案例:喜歡賺“差價”的營業員
3、 數據分析的六步曲
? 明確目的
? 收集數據
? 處理數據(預處理)
? 分析數據
? 呈現數據(可視化)
? 撰寫報告
案例:終端精準營銷項目過程討論
4、 數據分析師需要什么樣的能力
? 懂業務、懂管理、懂分析、懂工具、懂呈現
5、 大數據應用系統的四層結構
? 數據基礎層、數據模型層、業務模型層、業務應用層
6、 數據分析方法的層次
? 基本分析法(對比/分組/結構/趨勢/…)
? 綜合分析法(交叉/綜合評價/杜邦/漏斗/…)
? 高級分析法(相關/方差/驗證/回歸/時序/…)
? 數據挖掘法(聚類/分類/關聯/RFM模型/…)
7、 基本分析方法及其適用場景
? 對比分析(查看數據差距)
演練:按性別、省份、產品進行分類統計
? 分組分析(查看數據分布)
演練:銀行信用卡月消費分析(銀行)
演練:呼叫中心接聽電話效率分析(呼叫中心)
演練:客服中心科學排班人數需求分析(客服中心)
演練:客戶年齡分布分析
案例:排班后面隱藏的貓膩
? 結構分析(評估事物構成)
案例:用戶市場占比結構分析
案例:物流費用占比結構分析(物流)
? 趨勢分析(發現變化規律)
案例:破解零售店銷售規律
8、 綜合分析方法及其適用場景
? 交叉分析(兩維分析)
演練:用戶性別 地域分布分析
? 綜合評價法(多維指標歸一)
演練:人才選拔評價分析(HR)
案例:南京丈母娘選女婿分析表格
? 杜邦分析法(關鍵因素分析-財務數據分析)
案例:電信市場占有率分析
演練:服務水平提升分析(呼叫中心)
案例:銷售額的影響因素分析(零售店/電商)
? 漏斗分析法(關鍵流程環節分析-流失率與轉化率分析)
演練:終端銷售流程分析(電信營業廳)
案例:業務辦理流程優化分析(銀行營業廳)
案例:物流配送效率分析(物流)
? 矩陣分析法(產品策略分析-象限圖分析法)
案例:工作安排評估
案例:HR人員考核與管理
案例:波士頓產品策略分析
9、 **合適的分析方法才是硬道理。
10、 數據分析思路(如何細化業務問題)
案例:利用5W2H來分析產品銷售情況
第三部分:概率與數理統計篇1、 數據統計指標
? 集中程度:平均數/中位數/眾數
? 離散程度:全距/四分位距/標準差/四分位
? 分布形態:偏度/峰度
? 正確理解各指標的含義
案例:如何用Excel計算統計指標
案例:如何用Excel畫直方圖
2、 概率論基本知識
? 隨機事件與概率
? 古典概率與條件概率
? 全概率公式與貝葉斯公司
? 概率分布函數
? 數學期望與方差
? 大數定律與中心極限定理
3、 參數檢驗分析
? 假設檢驗概述
? 假設檢驗步驟
? 樣本T檢驗(單樣本、兩獨立樣本、兩配對樣本)及適用場景
案例:電信運營商ARPU值評估分析(單樣本)
案例:營銷活動前后分析(兩配對樣本)
案例:吸煙與膽固醇升高的分析(兩獨立樣本)
4、 非參數檢驗分析
? 非參數檢驗概述
? 樣本檢驗(單樣本、兩獨立樣本、兩相關樣本)
案例:產品合格率檢驗(單樣本-二項分布)
案例:訓練新方法有效性檢驗(兩配對樣本-符號/秩檢驗)
案例:促銷方式效果檢驗(多相關樣本-Friedman檢驗)
案例:客戶滿意度差異檢驗(多相關樣本-Cochran Q檢驗)
第四部分:高級數據分析本篇包含三大內容:影響因素分析,數值預測模型。
1、 相關分析(衡量變量間的的相關性)
問題:營銷費用會影響銷售額嗎?影響程度大嗎?
? 什么是相關關系
? 相關系數:衡量相關程度的指標
? 相關分析的步驟與計算公式
? 相關分析應用場景
演練:體重與腰圍的關系
演練:營銷費用與銷售額的關系
2、 方差分析
問題:哪些才是影響銷量的關鍵因素?
? 方差分析解決什么問題
? 方差分析種類:單因素/雙因素可重復/雙因素無重復
? 方差分析的應用場景
? 如何解決方差分析結果
演練:產品擺放位置與銷量有關嗎?(單因素方差分析)
案例:2015年大學生工資與父母職業的關系
3、 回歸分析(預測)
問題:如何預測未來的銷售量(定量分析)?
? 回歸分析的基本原理和應用場景
? 回歸分析的種類(一元/多元、線性/曲線)
? 回歸分析的幾種常用方法
? 回歸分析的五個步驟與結果解讀
? 回歸預測結果評估(如何評估預測質量,如何選擇**回歸模型)
演練:散點圖找推廣費用與銷售額的關系(一元線性回歸)
演練:推廣費用、辦公費用與銷售額的關系(多元線性回歸)
演練:**選擇的預測銷售額的回歸模型(一元曲線回歸)
? 回歸分析(帶分類變量)
案例:汽車銷量的季度預測
演練:工齡、性別與終端銷量的關系
討論:終端銷售預測分析(營業廳)
4、 時序分析(預測)
問題:隨著時間變化,未來的銷量變化趨勢如何?
? 時序分析的應用場景(基于時間的變化規律)
? 移動平均的預測原理
? 指數平滑的預測原理
案例:銷售額的時序預測及評估
演練:產品銷量預測及評估第五部分:建立預測模型與模型優化(Excel工具)本篇包含內容:數值預測建模、模型優化,季節性預測模型、S曲線預測模型。
1、 常見預測模型類別
? 數值預測
? 分類預測
2、 回歸分析建模
? 尋找**回歸擬合線來判斷和預測
? 模型優化七步法(因素、異常值、相互作用、非線性關系…)
案例:汽車銷量預測分析
案例:工齡、性別與銷量的回歸分析
3、 季節性預測模型
? 季節性預測模型的參數
? 常用季節性預測模型(相加模型、相乘模型)
案例:美國航空旅客里程的季節性趨勢分析
案例:產品銷售季節性趨勢預測分析
4、 新產品銷量預測與S曲線
? 如何評估銷量增長的拐點
? 常用模型(珀爾曲線、龔鉑茲曲線)
案例:預測IPad產品的銷售增長拐點,以及銷量上限
5、 規劃求解與自定義模型
案例:大數據下的產品定價方法
案例:如何對客流量進行建模及模型優化
第五部分:數據挖掘篇(SPSS工具使用)1、 數據挖掘概述
2、 數據挖掘的標準流程
? 商業理解
? 數據準備
? 數據理解
? 模型建立
? 模型評估
? 模型應用
案例:通信客戶流失分析及預警模型
3、 聚類分析(市場細分與客戶細分)
問題:如何實現客戶細分,開發符合細分市場的新產品?
? 聚類分析及其作用
? 聚類分析的種類
? 層次聚類:發現多個類別
? R型聚類與Q型聚類的區別
演練:中國省市經濟發展情況分析(Q型聚類)
演練:裁判評分的標準衡量(R型聚類)
? K均值聚類
演練:寶潔公司如何選擇新產品試銷區域?
演練:如何評選優秀員工?
4、 分類分析
案例:美國零售商(Target)如何預測少女懷孕
問題:如何提取客戶流失者、拖欠貨款者的特征?如何預測其流失的概率?
? 分類與聚類
? 決策樹分類的原理
? 如何評估分類性能
演練:識別銀行欠貨風險,提取欠貨者的特征
5、 關聯分析
案例:啤酒與尿布、颶風與蛋撻
問題:購買面包的人是否也會購買牛奶?他們同時購買哪些產品?
? 關聯分析解決什么樣的問題
? 如何提取關聯規則
? 關聯規則的應用場景
案例:超市商品交叉銷售與布局優化(關聯分析)
6、 RFM模型
問題:如何評估客戶的價值?如何針對不同客戶采取不同的營銷策略?
? RFM模型介紹
? RFM的客戶細分框架理解
演練:淘寶客戶選擇促銷客戶的方式
演練:結合響應模型,宜家IKE實現**大化營銷利潤
第六部分:數據挖掘實戰篇(Modeler工具實操)1、 數據挖掘處理的一般過程
? 數據源à數據理解à數據準備à探索分析à數據建模à模型評估
2、 數據讀入
3、 數據集成
? 變量合并(增加變量)
? 數據追加(添加記錄)
4、 數據理解
? 取值范圍限定
? 重復數據處理
? 缺失值處理
? 無效值處理
? 離群點和極端值的修正
? 數據質量評估
5、 數據準備:數據處理
? 數據篩選:數據抽樣/選擇(減少樣本數量)
? 數據精簡:數據分段/離散化(減少變量的取值)
? 數據平衡:正反樣本比例均衡
? 其它:排序、分類匯總
6、 數據準備:變量處理
? 變量變換:原變量值更新
? 變量派生:生成新的變量
? 變量精簡:降維,減少變量個數
7、 基本分析
? 單變量:數據基本描述分析
? 雙變量:相關分析、方差分析、卡方檢驗(列聯檢驗)
? 變量精簡:特征選擇、因子分析
案例:通信基本費用與開通月數的相關分析
案例:開通月數對客戶流失的影響分析
案例:套餐類型對對客戶流失的影響分析
8、 特征選擇
? 特征選擇方法:選擇重要變量,剔除不重要的變量
? 從變量本身考慮
? 從輸入變量與目標變量的相關性考慮
9、 因子分析(主成分分析)
? 因子分析的原理
? 因子個數如何選擇
? 如何解讀因子含義
案例:提取影響電信客戶流失的主成分分析
10、 常見分類預測模型
? 分類預測基本過程
? 如何評估分類模型的性能(查準率、查全率)
11、 決策樹分類
? 決策樹分類原理
? 決策樹構建的三個關鍵問題
? 決策樹算法
案例:識別銀行欠貨風險,提取欠貨者的特征
案例:客戶流失預警與客戶挽留模型
12、 神經網絡
? 神經網絡概述
? 神經元工作原理
? BP反向傳播網絡(MLP)
? 徑向基函數網絡(RBF)
13、 支持向量機
14、 貝葉斯分類
共有 0 條評論