1. Excel
Excel是最容易上手的圖表工具,善于處理快速少量的數(shù)據(jù)。結(jié)合數(shù)據(jù)透視表,VBA語言,可制作高大上的可視化分析和dashboard儀表盤。
單表或單圖用Excel制作是不二法則,它能快速地展現(xiàn)結(jié)果。但是越到復(fù)雜的報表,excel無論在模板制作還是數(shù)據(jù)計算性能上都稍顯不足,任何大型的企業(yè)也不會用Excel作為數(shù)據(jù)分析的主要工具。
2. 可視化 BI(Power BI \Tableau \ 帆軟FineBI等等)
也許是Excel也意識到自己在數(shù)據(jù)分析領(lǐng)域的限制和眼下自助分析的趨勢,微軟在近幾年推出了BI工具Power BI。同可視化工具Tableau和國內(nèi)帆軟的BI工具一樣,封裝了所有可能分析操作的編程代碼,操作上都是以點擊和拖拽來實現(xiàn),幾款工具的定位稍有不同。
Power BI
最大的明顯是提供了可交互、鉆取的儀表板,利用Power Pivot可直接生產(chǎn)數(shù)據(jù)透視報告,省去了數(shù)據(jù)透視表。
Tableau
可視化圖表較為豐富,堪稱一等, 操作更為簡單。
帆軟FineBI
企業(yè)級的BI應(yīng)用,實用性較強,因2B市場的大熱受到關(guān)注。千萬億級的數(shù)據(jù)性能可以得到保證,業(yè)務(wù)屬性較重,能與各類業(yè)務(wù)掛鉤。
對于個人,上手簡單,可以騰出更多的時間去學(xué)習(xí)業(yè)務(wù)邏輯的分析。
對于尋求更高境界數(shù)據(jù)分析師或數(shù)據(jù)科學(xué)家,如果掌握可視化的編程技巧,就可以利用數(shù)據(jù)做更多的事情。熟練掌握一些編程技巧,賦予數(shù)據(jù)分析工作更加靈活的能力,各種類型的數(shù)據(jù)都能適應(yīng)。大多數(shù)設(shè)計新穎、令人驚艷的數(shù)據(jù)圖幾乎都可以通過代碼或繪圖軟件來實現(xiàn)。
與任何語言一樣,你不可能立刻就開始進行對話。要從基礎(chǔ)開始,然后逐步建立自己的學(xué)習(xí)方式。很可能在你意識到之前,你就已經(jīng)開始寫代碼了。關(guān)于編程最酷的事情在于,一旦你掌握了一門語言,學(xué)習(xí)其他語言就會更加容易,因為它們的邏輯思路是共通的。
1. Python語言
Python 語言最大的優(yōu)點在于善于處理大批量的數(shù)據(jù),性能良好不會造成宕機。尤其適合繁雜的計算和分析工作,而且,Python的語法干凈易讀,可以利用很多模塊來創(chuàng)建數(shù)據(jù)圖形比較受IT人員的歡迎。
利用 Python 生成的圖表
2. PHP語言
PHP這個語言松散卻很有調(diào)理,用好了功能很強大。在數(shù)據(jù)分析領(lǐng)域可以用php做爬蟲,爬取和分析百萬級別的網(wǎng)頁數(shù)據(jù),也可與Hadoop結(jié)合做大數(shù)據(jù)量的統(tǒng)計分析。
因為大部分 Web 服務(wù)器都事先安裝了 PHP 的開源軟件,省去了部署之類的工作,可直接上手寫。
比如 Sparkline(微線表)庫,它能讓你在文本中嵌入小字號的微型圖表,或者在數(shù)字表格中添加視覺元素,就像下面這張圖一樣:
利用 PHP 圖形函數(shù)庫生成的微線表
一般 PHP會和 MySQL 數(shù)據(jù)庫結(jié)合使用,這使它能物盡其用,處理大型的數(shù)據(jù)集。
3. HTML、JavaScript 和 CSS語言
很多可視化軟件都是基于web端的,可視化的開發(fā),這幾類語言功不可沒。而且隨著人們對瀏覽器工作越來越多的依賴,Web 瀏覽器的功能也越來越完善,借助 HTML、JavaScript 和 CSS,可直接運行可視化展現(xiàn)的程序。
可交互日歷,同時也是用戶使用 your.flowingdata 的熱度圖
不過還是有幾點需要注意。由于相關(guān)的軟件和技術(shù)還比較新,在不同瀏覽器中你的設(shè)計可能在顯示上會有所差別。在 Internet Explorer 6 這類老舊的瀏覽器中,有些工具可能無法正常運行。比如一些銀行單位仍舊使用著IE,無論是自己使用還是開發(fā)的時候都要考慮這樣的問題。
4. R語言
R語言是絕大多數(shù)統(tǒng)計學(xué)家最中意的分析軟件,開源免費,圖形功能很強大。
談到R語言的歷史,它是專為數(shù)據(jù)分析而設(shè)計的,面向的也是統(tǒng)計學(xué)家,數(shù)據(jù)科學(xué)家。但是由于數(shù)據(jù)分析越來越熱門,R語言的使用也不瘦那么多限制了。
R的使用流程很簡潔,支持 R 的工具包也有很多,只需把數(shù)據(jù)載入到 R 里面,寫一兩行代碼就可以創(chuàng)建出數(shù)據(jù)圖形。比如利用 Portfolio 工具包快速創(chuàng)建出如下的板塊層級圖。
比如熱度圖
R 生成的熱度圖
當然還有很多傳統(tǒng)的統(tǒng)計圖表。
聯(lián)系客服