數(shù)據(jù)分析,不是一個簡單的操作,而是一個完整的過程。
一般地,一個完整的數(shù)據(jù)分析包括了六個步驟,后一個步驟依賴前一個步驟,也是前一個過程的深入。
數(shù)據(jù)分析過程
第一步:明確目的。
首先,任何數(shù)據(jù)分析都是為了解決業(yè)務問題。因此,明確目的是數(shù)據(jù)分析有效進行的先決條件,也為后續(xù)提供清晰的指引方向。明確目的要做的工作如下:
1、 確定分析目的。即為什么要做數(shù)據(jù)分析,分析的背景以及目的是什么,要解決什么業(yè)務問題,并進一步對業(yè)務分析進行分解。
2、 確定分析思路。圍繞業(yè)務目的,梳理分析思路,搭建分析框架。比如,要從哪幾個角度進行分析,采用哪些分析指標,等等。
分析思路
第二步:收集數(shù)據(jù)。
當確定分析目的之后,接下來就需要圍繞業(yè)務問題來收集相關(guān)的數(shù)據(jù),數(shù)據(jù)收集為分析數(shù)據(jù)提供素材與依據(jù)。需要明確下面工作:
1、 明確收集范圍。即需要收集哪些數(shù)據(jù),數(shù)據(jù)的名稱、類型、時間范圍等等。
2、 確定收集來源。數(shù)據(jù)的來源可以是多樣性的,可以是互聯(lián)網(wǎng)、公開出版物,以及一些專門的咨詢機構(gòu),當然更多的數(shù)據(jù)來源是本企業(yè)的IT系統(tǒng)及數(shù)據(jù)庫(比如CRM、BOSS、營銷系統(tǒng)等)。
3、 確定收集方法。采用哪些方法可以快速獲得想要的數(shù)據(jù)呢?是抽樣,還是需要普查?是只需要樣本還是數(shù)據(jù)全集?調(diào)查的渠道有哪些?對于一些特定的分析任務,還需要進行市場調(diào)查,通過專門的市場調(diào)查機構(gòu)來獲取數(shù)據(jù)。
第三步:整理數(shù)據(jù)。
數(shù)據(jù)預處理是對收集到的數(shù)據(jù)進行加工、整理,形成適合分析的格式,是分析前不可缺少的階段。一般情況下,數(shù)據(jù)預處理所花費的時間占整個數(shù)據(jù)分析的60~80%的工作。預處理經(jīng)常要做的工作包括:
1、 數(shù)據(jù)預處理
a) 數(shù)據(jù)清洗。去掉或合并重復的數(shù)據(jù),刪除無效數(shù)據(jù),補齊缺失數(shù)據(jù)。
b) 數(shù)據(jù)轉(zhuǎn)化。將原始的數(shù)據(jù)轉(zhuǎn)化為新的數(shù)據(jù)格式,比如,將性別(男,女)轉(zhuǎn)換為數(shù)值(1,0)等等。
c) 數(shù)據(jù)提取。將幾個字段進行抽取、合并等形成新的字段,比如,從身份證中提取出性別,以及出生年月。
d) 數(shù)據(jù)計算。對數(shù)據(jù)進行基本的匯總、統(tǒng)計,比如,根據(jù)單價和數(shù)量,計算出總的消費金額。
2、 數(shù)據(jù)質(zhì)量評估
a) 有效性評估。數(shù)據(jù)的取值、單位是否有效。
b) 可靠性評估。來源是否專業(yè),可信度如何。
3、 合并多個表格
大多數(shù)分析方法都是基于一個數(shù)據(jù)集進行的,所以需要將眾多的數(shù)據(jù)表格進行合并,形成一個數(shù)據(jù)集。
第四步:分析數(shù)據(jù)。
分析數(shù)據(jù),就是用適當?shù)姆治龇椒ê凸ぞ撸瑢?shù)據(jù)進行分析,提取有價值的信息。這一步包含如下內(nèi)容:
1、 選擇分析方法。基于業(yè)務問題,需要選擇合適的分析方法,比如:分組分析、結(jié)構(gòu)分析、趨勢分析,不同的分析目的要采用不同的分析方法。
2、 選擇分析模型。對于復雜的業(yè)務問題,有可能還需要重新構(gòu)建分析模型,或者選擇已有的數(shù)據(jù)分析模型,比如回歸模型、聚類、決策樹分類,等等。
3、 選擇合適工具。常用的分析工具有通用的Excel數(shù)據(jù)分析,也有較專業(yè)的數(shù)據(jù)分析工具SPSS和SAS,各種不同的工具,其適用范圍及能夠解決的問題也不同。選擇合適的工具能夠讓你的分析工作更加有效。
4、選擇合適的分析語言。如果前面的分析工具都無法滿足業(yè)務的需求,那么就需要學習一些分析語言了,比如Python/R語言,來編寫業(yè)務數(shù)據(jù)的處理分析流程,以實現(xiàn)業(yè)務數(shù)據(jù)的自動化分析,滿足定制的業(yè)務流程需求。
第五步:呈現(xiàn)數(shù)據(jù)
數(shù)據(jù)呈現(xiàn),或者叫做數(shù)據(jù)可視化。數(shù)據(jù)可視化,能夠?qū)?shù)據(jù)很直觀地表達出來,讓閱讀者能夠一眼看出數(shù)據(jù)所要表達的業(yè)務邏輯,所謂一圖勝千言。分析師需要掌握最基本的可視化技術(shù):
1、 常用圖形。包括柱狀圖、條件圖、餅圖、折線圖、散點圖、雷達圖,等等。
2、 圖表工具。最常用的圖形工具,有Excel、水晶易表、SwiffChart等等。
掌握常用的圖形工具,能夠讓你的分析結(jié)果更直觀有效,更易理解,更容易找出數(shù)據(jù)中蘊含的業(yè)務規(guī)律和業(yè)務問題,從而能夠輔助決策。
第六步:撰寫報告
分析報告,是整個數(shù)據(jù)分析過程的一個總結(jié)。一個好的分析報告,需要圖文并茂,層次清晰,要有明確的分析結(jié)論,以及可行的建議和業(yè)務解決方案。
撰寫報告的過程,其實就是思考業(yè)務策略的過程,這是從數(shù)據(jù)分析轉(zhuǎn)換成業(yè)務策略最重要的一步。
所以,數(shù)據(jù)分析是一個完整的業(yè)務解決過程,發(fā)源于業(yè)務(業(yè)務問題),也回歸于業(yè)務(業(yè)務策略)。
聯(lián)系客服