大家好,我是零一,經(jīng)過深思熟慮,我把制作分析模型作為高階的內(nèi)容。學完高階的預期效果是可以獨立用Excel制作分析模型,并且還要掌握多一個分析工具。
鑒于本人的知識水平有限,依舊求拍磚,謝謝!
很喜歡一個小伙伴發(fā)的說說,我稍微改了下:學海無涯,分享是岸!贊同的轉(zhuǎn)起!
最近的感慨是這社會浮躁的人真多??!總想著快速致富或者達到目的,卻不想萬丈高樓平地起。
好!我們開始。
首先給大家介紹一些相關(guān)的數(shù)據(jù)分析工具:
開源工具有R、Rapidminer、Weka等等
閉源工具有Spss Statistics、Spss Modeler、Sas、Excel等等
(在我的網(wǎng)盤里面都有得下載)
開源是免費的工具,源碼是可以從網(wǎng)上下載下來的,一般只有英文版本。閉源工具是一些商業(yè)軟件,都是需要破解才能正常使用,否則就購買版權(quán)。
首先是Modeler,它比EXCEL是要簡單方便,圖也是可以編輯的,這里除了做圖之外還有很多模型,這些都是在實際數(shù)據(jù)挖掘里面都會應用到。Modeler是專門做商業(yè)數(shù)據(jù)分析與挖掘的工具.
用Modeler設(shè)計好數(shù)據(jù)流,也是可以達到分析自動化的目的,并且分析的方法會更加豐富。
Statistics也是SPSS系列的工具,主要是做統(tǒng)計分析的,跟SAS一樣都是業(yè)界內(nèi)非常古老的軟件。SAS現(xiàn)在已經(jīng)是一套系統(tǒng)了,體積有10G+。相應的也比較繁瑣。
EXCEL特點是易學難精。它是非常強大的,雖然容易入門,但不容易精通。它可以解決大部分的數(shù)據(jù)分析需求,也是界面化操作,但可以用VBA編程語言拓展功能。
RapidMiner只有英文版本,也是界面化操作且具有流程化,也是非常強大的一款工具,它在某些方面要比Modeler要強大很多。
R語言需要有一定的編程基礎(chǔ)的,可擴展性非常強。我非常喜歡的一款工具,相對來說比較難一點的??梢哉龊莒披惖膱D,非常的強大。
我個人喜歡的工具是EXCEL,R,Rapidminer。如果除了EXCEL外,讓我推薦,我建議大家可以考慮SPSS Modeler。因為這個是最簡單的工具,有中文版本,它的特點就是簡單易學,又是界面操作,專業(yè)度強且是流程化的工具。
=======================================================
下面,我們來學習用EXECL 2013為大家演示做一個分析模型。
這里是我提前抓取的數(shù)據(jù)。把數(shù)據(jù)全部選中,點擊插入表格后,數(shù)據(jù)表格周圍會出現(xiàn)流動的螞蟻線,會有一個創(chuàng)建表的對話框彈出,我們直接點確定就OK了。
然后我們再點擊插入數(shù)據(jù)透視表,一樣也會出現(xiàn)流動的螞蟻線,我們點確定就OK。
點擊確定后我們發(fā)現(xiàn),出現(xiàn)了一個全新的界面。
到了這一個界面,我們再把子行業(yè)成交量拖到行標簽,成交量拖到數(shù)值。再選中插入餅圖,會成為下面的一個樣式。
接著把右邊的圖例給刪除,右擊添加數(shù)據(jù)標簽,選中設(shè)置數(shù)據(jù)標簽格式,會出現(xiàn)一個圖例選項,我們選中類別名稱跟百分比。之后,我們這個餅圖就做好了,做好后,我們可以將它進行調(diào)整到美觀跟清晰大小。另外加上圖表的配色這些都是可以自定義的哦。圖標的名稱更改都是可以自行進行設(shè)置。
第一步:刪除圖例
第二步:右擊圖片,選中添加數(shù)據(jù)標簽
第三步:點中數(shù)據(jù),選中設(shè)置數(shù)據(jù)標簽格式
第四步:選中類別名稱跟百分比
第五步:修改圖標標題
到這里就已經(jīng)完成了單個的占比圖,如果要看每個月的占比情況,可以選擇堆積條形圖。
這張圖就是堆積條形圖,每個月都是100%,反映每個月下,各個分類的占比情況,色塊越大代表占比越大??梢郧逦闯瞿硞€子行業(yè)全年的占比走勢。
把行業(yè)數(shù)據(jù)(子行業(yè)和屬性)展示出來,配合餅圖、折線圖(參考初階第一篇)和堆積條形圖可以做出漂亮的分析模型。下面教大家做個按鍵,來實現(xiàn)半自動刷新。
首先插入一個ActiveX控件,選擇命令按鈕
右擊命令按鈕設(shè)置屬性
修改命令按鍵顯示的文字
進入設(shè)置代碼
敲入ThisWorkbook.RefreshAll這段代碼,然后關(guān)閉工程編輯器,并退出設(shè)計模式(在設(shè)計模式下,命令按鍵是不起作用的。
點擊【設(shè)計模式】退出設(shè)計模式
下面,我們來試下刷新數(shù)據(jù)
先把舊的數(shù)據(jù)刪除(不包含列名),注意是刪除表行,不是按delete(我相信雖然我說了,但還是有一大堆朋友會按delete,然后來找我,怎么跟你的不一樣。我表示這個問題我會自動屏蔽)
然后,把新的數(shù)據(jù)粘貼入表格里面
點擊一下刷新圖表,即可刷新
下圖是刷新后的結(jié)果
另外,可以插入日程表,來實現(xiàn)切換時間維度,比如分季度查看每個記錄的數(shù)據(jù)報表(數(shù)據(jù)源必需有日期格式的數(shù)據(jù),否則不能插入日程表)
另外也可以配合切片器(參考初階第三篇)來實現(xiàn)維度的切換,整個報表會更加智能。
========================================================
下面我們來做一份有關(guān)店鋪的轉(zhuǎn)化率,訪問深度,等緯度進行分析。
這是一份從量子導出的店鋪數(shù)據(jù)分PC和無線兩個終端,分別在兩個CSV文件里面
先簡單處理下數(shù)據(jù),把周總和、平均值刪除。另外把“-”給替換成0
接著,用我寫好的模塊。來處理這些數(shù)據(jù)。
進入Visual Basic,導入我寫好的模塊。(模塊在我網(wǎng)盤)
然后新建一個sheet
運行我寫好的模塊
執(zhí)行宏后會看到標準的數(shù)據(jù)結(jié)構(gòu)
把日期的格式給設(shè)置一下
效果:
然后重復前面的操作,插入表格-插入數(shù)據(jù)透視表-插入圖表-插入切片器和日程表
稍微排版一下,工作表名:分析報表
這樣子一個簡單的監(jiān)控分析模型就做好了,這里沒有任何的分析方法,只是實現(xiàn)了數(shù)據(jù)展現(xiàn),方便分析師對各種數(shù)據(jù)維度進行對比。
另外,用數(shù)據(jù)分析,來看下最基本的各個維度的相關(guān)性。
首先打開Excel自帶的分析工具庫
勾選分析工具庫后,可以在數(shù)據(jù)選項卡中找到這個工具庫
關(guān)于相關(guān)性的知識可以參考中階第九篇
另外,我們也可以將相關(guān)性可視化展示。
這時用到的是原始的數(shù)據(jù)結(jié)構(gòu),將數(shù)據(jù)轉(zhuǎn)換成表格,工作表名:相關(guān)性源數(shù)據(jù)
然后設(shè)置自定義名稱
X軸的值
Y軸的值
插入散點圖
設(shè)置數(shù)據(jù)
確定后就可以看到散點圖(讀法依舊參考中階第九篇)
現(xiàn)在我們要實現(xiàn)全維度的變換觀察,插入表單控件的組合框
準備好列表(把表頭復制了后轉(zhuǎn)置粘貼即可)
設(shè)置控件
第一個控件設(shè)置好,復制多一個,只需要把單元格鏈接的105改成106就可以了,分別指向兩個單元格,前面我們定義的名稱,X是根據(jù)A105的值變化,Y是根據(jù)A106的值變化。
將A105和A106數(shù)值隱藏起來
簡單排版一下
這個散點圖,只要把源數(shù)據(jù)替換,就會自動刷新(原理是表格的功能特性)
整個模型的效果:
所有的中間層數(shù)據(jù)表我都隱藏了,可以通過取消隱藏來查看中間層數(shù)據(jù)
由于之前的共享鏈接涉及版權(quán)問題已經(jīng)被屏蔽了。因此,我只留下我自己的東西,繼續(xù)給大家分享。
新地址是:
http://pan.baidu.com/s/1c0jBMd6