“一千人眼里有一千個哈姆雷特”,說明每個人對事情的理解都存在差異。而數(shù)據(jù)分析師在工作中,對于自己的想法和理解,不可避免會有一定程度的依賴。所以培養(yǎng)數(shù)據(jù)分析師規(guī)范的思維邏輯,至關(guān)重要。
首先咱們來梳理一下數(shù)據(jù)分析的流程:
1.明確分析目的和思路:在進行數(shù)據(jù)分析之前,首先考慮的應(yīng)該是“為什么要展開數(shù)據(jù)分析?我要解決什么問題?從哪些角度分析數(shù)據(jù)才系統(tǒng)?用哪個分析方法最有效?”,而不是“這此分析需要出多少頁報告?打算用高級分析算法試試…”這樣的思維方式。只有明確了分析目的和思路,數(shù)據(jù)分析的方向才不會跑偏,才能得出有意義的結(jié)論。
2.數(shù)據(jù)收集:明確了分析目的,接下來就是開工收集數(shù)據(jù)了。數(shù)據(jù)的來源有很多種,例如原始數(shù)據(jù)(第一手數(shù)據(jù))、數(shù)據(jù)庫(第二手數(shù)據(jù))、公開出版物、互聯(lián)網(wǎng)、市場調(diào)查等。公司普遍都有數(shù)據(jù)庫,常用于公司業(yè)務(wù)等方面的分析;《世界發(fā)展報告》、《中國人口統(tǒng)計》等是很常用的公開出版物,具有一定的權(quán)威性。利用國家統(tǒng)計局網(wǎng)站、政府機構(gòu)網(wǎng)站、傳播媒體網(wǎng)站等,是最常用的互聯(lián)網(wǎng)獲取數(shù)據(jù)方式。
3.數(shù)據(jù)處理:包括數(shù)據(jù)清洗、轉(zhuǎn)換、分組等處理方法。我們拿到的數(shù)據(jù),通常情況下是不可直接使用的,比如數(shù)據(jù)有丟失、重復(fù)、有錄入錯誤或存在多余維度等情況。只有經(jīng)過處理后的數(shù)據(jù)才可以使用。
4.數(shù)據(jù)分析:在明確分析思路的前提下,選用適合的分析方法對處理后的數(shù)據(jù)進行分析。
5.數(shù)據(jù)展現(xiàn):將分析結(jié)果用圖表來展現(xiàn)。這也是需要花費一番功夫的,比如你想展示本月的網(wǎng)站用戶轉(zhuǎn)化率情況,可以選擇柱形圖,但為了體現(xiàn)每階段用戶流失情況,以漏斗圖展示更為直觀貼切。所以數(shù)據(jù)展現(xiàn)階段,你需要思考“采用這個圖表,能否清晰的表達出分析結(jié)果?我想表達的觀點是否完全展示出來了?”
FineReport 數(shù)據(jù)報表
6.報告撰寫:將數(shù)據(jù)分析的整個過程和結(jié)果,以書面的形式向他人說明。需要將分析目的、數(shù)據(jù)來源、分析過程、分析結(jié)論和建議等內(nèi)容展現(xiàn)在報告中。
數(shù)據(jù)分析工具可以分為這樣幾類:
Excel & 報表工具
BI工具
R、Python、Matlab等數(shù)據(jù)分析語言
以上,Excel范圍最廣,適合新上手使用。報表工具和BI工具企業(yè)商用較多;R、Python之類適合有編程基礎(chǔ)的數(shù)據(jù)分析師使用,開源的。
Excel不用多說,熟練掌握數(shù)據(jù)透視表,掌握常用的公式,懂一點開發(fā),會寫一些vlookup。
報表工具形同Excel,用來做dashboard很方便,好處就在于簡單,數(shù)據(jù)透視、圖表制作這些功能封裝好的。譬如FineReport,整個過程就是連數(shù)據(jù),設(shè)計模板,web展示。圖表是內(nèi)設(shè)好的或者開發(fā)對接Hcharts/Echarts/D3圖標庫,一般內(nèi)置的圖表以及夠用了。
BI就是更高級的報表工具,圖表、控件什么的都是拖拽實現(xiàn)。整個分析的過程包括數(shù)據(jù)清洗、轉(zhuǎn)換、分組等處理方法,以及數(shù)據(jù)分析。相比報表工具,報表系統(tǒng)更著重于短期的運作支持,而BI則關(guān)注長期的戰(zhàn)略決策,甚至更著重于商業(yè)趨勢和業(yè)務(wù)單元的聯(lián)系而非具體的數(shù)據(jù)和精確度本身。BI并不是用來代替著眼于日常運做的報表系統(tǒng)的。
FineReport 數(shù)據(jù)報表
數(shù)據(jù)分析的三大誤區(qū),看看你有沒有踩中。
1.無明確的分析目的,完全為了分析而分析
與數(shù)據(jù)分析流程的第一步相同,分析目的要明確,你需要思考的是:采用什么方法才能達到分析的目的,到底哪種圖表才能完全展現(xiàn)你想要表達的意圖,這幾個分析維度是否全面,是否可以支撐分析結(jié)論等等,是自然而然的進行相應(yīng)的問題分析。
2.不懂業(yè)務(wù)、不懂管理,分析結(jié)果空洞化
許多剛?cè)胄械男率謧?,對于銷售、企業(yè)運營等業(yè)務(wù)層面的東西,并不十分精通。比如領(lǐng)導(dǎo)需要一份本季度銷售報告,如果僅僅利用統(tǒng)計知識進行同比、環(huán)比等維度分析,那么在你的報告中,一定沒有領(lǐng)導(dǎo)想看到的信息。領(lǐng)導(dǎo)想看到什么呢?如果你懂業(yè)務(wù)和管理,你就會知道,利用分析模型:4P、用戶使用模型、SWOT等模型進行下切,找出本季度銷量好或者不好的原因,具體到哪一個部門或哪個人的責(zé)任 。并站在更高的角度,從全局來看:本年的銷量情況占比如何,發(fā)展趨勢是否在預(yù)計范圍內(nèi)。并提出結(jié)合業(yè)務(wù)的合理化建議,供領(lǐng)導(dǎo)參考。
3.看中高級算法,不在乎是否合適
每個算法都有其優(yōu)勢和局限性,在進行數(shù)據(jù)分析時,應(yīng)該選擇可以快速、準確的計算、得出結(jié)論的算法。正所謂“白貓黑貓,捉到老鼠就是好貓”。
好了,以上就是數(shù)據(jù)分析師應(yīng)具備的分析思維。希望你我共同努力,在數(shù)據(jù)分析師的道路上,不斷升級打怪,修煉自我,朝著專家領(lǐng)域進發(fā)!
聯(lián)系客服