我喜歡數(shù)據(jù),并將它廣為人知。
如果您最近和我參加聚會(huì),我在您耳邊說(shuō)的都是有關(guān)數(shù)據(jù)可視化工具或者最近使用的酷R包,對(duì)此我在這向您表示歉意。
如果您和我玩范特西游戲,歡迎您來(lái)到圖表世界,這里有很多的圖表。
不要為越來(lái)越頻繁地聽(tīng)到下面的問(wèn)題感到驚訝:“Nick,我想走向數(shù)據(jù)分析和數(shù)據(jù)可視化,我應(yīng)該從哪里開(kāi)始?”
不幸的是,沒(méi)有一個(gè)完美的答案適合所有的人–每一個(gè)人的需求不同且人們已經(jīng)知道的東西相差很大。但令我高興的是一件關(guān)于最近科技/教育/商業(yè)環(huán)境事情:
來(lái)自不同職業(yè)道路和背景的聰明人都對(duì)自己說(shuō):“我需要從數(shù)據(jù)中得到更多”。
但是,在很多初學(xué)者溝通后,發(fā)現(xiàn)了的共性。很明顯,這些共性不是適合每一個(gè)人的:
一個(gè)老練的工程師會(huì)嘲笑共性上說(shuō)的第一時(shí)間學(xué)習(xí)Java腳本或者Python。
早已知道D3.js 的人會(huì)疑惑選擇哪一個(gè)可視化工具?或者疑惑怎么樣將數(shù)據(jù)驅(qū)動(dòng)轉(zhuǎn)換應(yīng)用頂級(jí)的3D中?
這些適合想進(jìn)一步了解接近數(shù)據(jù)可視化的學(xué)術(shù)科學(xué)家、學(xué)校老師、研究咨詢(xún)師、項(xiàng)目經(jīng)理、失業(yè)快樂(lè)族或者M(jìn)BA畢業(yè)生……。
如果符合你,我認(rèn)為你應(yīng)該開(kāi)始于從“無(wú)編碼”有計(jì)劃地學(xué)習(xí)到“愛(ài)編碼”。
首先,如果你對(duì)excel一無(wú)所知,這是值得去做的。嚴(yán)肅地告訴你至少得學(xué)會(huì)透視表,聽(tīng)起來(lái)有些差勁,但是Excel能做很多超乎人們想象的事情。如果你善于嘗試,Excel甚至能做出很多漂亮的圖表。
如果你已經(jīng)有一些數(shù)據(jù),僅僅想用一個(gè)好的工具來(lái)探索可視化或者輸出更多引人注目的圖表。Tableau 就很流行、功能驚人,它有免費(fèi)的公共版和一個(gè)十分昂貴費(fèi)用的付費(fèi)版,
不過(guò)如果你是學(xué)生就可以享受到免費(fèi)版。它一般會(huì)在網(wǎng)上,或者論文上以靜態(tài)圖表形式發(fā)布,也可以傳送到Instagram上或者以墻圖輸出。在它的官網(wǎng)上可以找到很多模板,激發(fā)你的靈感。
遺憾地是,將要探討的另一個(gè)工具–Infoactive,可惜已經(jīng)下架了,但沒(méi)關(guān)系,Tableau吸收了Infoative所有優(yōu)點(diǎn)。這個(gè)意味著Tableau很有可能是未來(lái)公認(rèn)的好工具。我將牽頭一本免費(fèi)的書(shū),它是Infoactive團(tuán)隊(duì)帶領(lǐng)下涉及數(shù)據(jù)可視化設(shè)計(jì)工具的背景資料,下面談?wù)摰娜魏喂ぞ?
一個(gè)簡(jiǎn)單有關(guān)準(zhǔn)備和可視化信息的說(shuō)明介紹
如果要選擇一款獨(dú)立的程序語(yǔ)言來(lái)操作單機(jī)數(shù)據(jù),我會(huì)選擇R語(yǔ)言。因?yàn)镽語(yǔ)言是免費(fèi)的,且支持大量的在線開(kāi)發(fā)加載有用的頂級(jí)基礎(chǔ)語(yǔ)言程序包,并且有大量的免費(fèi)資源學(xué)習(xí)如何運(yùn)用它。在這些資源中–我極力推薦Coursera課程:
約翰霍普金斯大學(xué)驗(yàn)證通過(guò)的數(shù)據(jù)科學(xué)專(zhuān)業(yè)化專(zhuān)家成為數(shù)據(jù)科學(xué)家自由談?wù)摗?/p>
它們可能會(huì)抹殺一個(gè)真正的初學(xué)者,但是課程能帶你走出一條重要數(shù)據(jù)科學(xué)項(xiàng)目和想法的路線,通過(guò)所有的方式探索數(shù)據(jù)分析(它涵蓋了有用的R包,例如ggplot,一個(gè)十分受歡迎的可視化工具)的交互性,通過(guò)Shiny和數(shù)據(jù)故事發(fā)布在網(wǎng)頁(yè)上。
R是我最常用來(lái)處理小型快速的分析和數(shù)據(jù)可視化工具–如果有一個(gè)數(shù)據(jù)(數(shù)據(jù)量大、不易于可視化)Excel處理不了,R最適合快速探索。
“是的,你可能要學(xué)些一些SQL”,另外一個(gè)快速入門(mén)的語(yǔ)言–SQL,與R相比(實(shí)際上,這已經(jīng)超出了蘋(píng)果和蘋(píng)果的比較),SQL是一門(mén)比較有針對(duì)性的語(yǔ)言:
如果你希望在數(shù)據(jù)庫(kù)中用任何工具或者語(yǔ)言集成數(shù)據(jù),這將是一個(gè)很好的機(jī)會(huì)讓你有學(xué)習(xí)SQL的興趣。
通常,在網(wǎng)頁(yè)上看到一個(gè)美好的交互式可視化界面,都會(huì)浮現(xiàn)一個(gè)問(wèn)題“我們要從何學(xué)起?”。我著迷于這個(gè)創(chuàng)新的領(lǐng)域(點(diǎn)擊這可以看更多深入的調(diào)查)。
不幸地是,如果你喜歡這些作品:
讓我們重新審視73英尺高的邊界,提出了我們的建議,看看我們是怎樣地提高直覺(jué)。明顯地……
……它可以令你沮喪的發(fā)現(xiàn)還有多少東西需要自己學(xué)習(xí)。反復(fù)的實(shí)踐以求得“《紐約時(shí)報(bào)》一樣好”是一個(gè)艱難的目標(biāo),值得但是困難。
幸運(yùn)的是,這里有很多幫助資源。
交互式的作品后面的邏輯庫(kù),和很多在網(wǎng)頁(yè)上運(yùn)行的數(shù)據(jù)可視化作品都是Mike Bostock創(chuàng)作的D3.js。D3.js是一個(gè)很好的工具去學(xué)習(xí)作品網(wǎng)頁(yè)發(fā)布和交互式。
博斯托克(Bostock)的網(wǎng)站是一個(gè)有關(guān)金礦的例子和教程網(wǎng)站(你不需要筋疲力竭地從邏輯庫(kù)的創(chuàng)建者學(xué)起……)。
我也推薦Murry創(chuàng)建的網(wǎng)頁(yè)版交互式數(shù)據(jù)可視化,你可以從 O’Reilly 那購(gòu)買(mǎi)或者網(wǎng)上在線免費(fèi)使用:
這是一個(gè)關(guān)于非程序員的編程數(shù)據(jù)可視化的書(shū)。如果你是一個(gè)擁有視覺(jué)技能的藝術(shù)家或圖形設(shè)計(jì)師,但沒(méi)有從事數(shù)據(jù)或代碼工作的先驗(yàn)經(jīng)驗(yàn),這本書(shū)適合你。如果你是一個(gè)擁有大量數(shù)據(jù)的記者或研究人員,但沒(méi)有數(shù)據(jù)可視化或代碼的先驗(yàn)工作,這本書(shū)也適合你。
在線版本很好–你可以跟著書(shū)本本身編寫(xiě)代碼腳本,運(yùn)行它并拿你的輸出結(jié)果和模板比較。Murray 還特別為初學(xué)者量身定制,這個(gè)網(wǎng)站能很好的引導(dǎo)初學(xué)者從HTML/CSS和Javascript基礎(chǔ)到深入學(xué)習(xí)相對(duì)難的D3。
D3的地理空間可視化是一個(gè)值得一提的長(zhǎng)處。D3擅長(zhǎng)創(chuàng)造很多不同效果的地圖,如果這是你的專(zhuān)業(yè)領(lǐng)域,這里可以獲得不錯(cuò)的專(zhuān)用教程:
我以前讓地圖教程介紹了如何用D3和topojson做一個(gè)基本的地圖;現(xiàn)在是時(shí)候讓它覆蓋……
D3很難操作,但也有工具能降低難度,我建議使用最基礎(chǔ)的D3而不是復(fù)雜的繪圖程序,如果你人覺(jué)得棘手,那使用Plot.ly會(huì)更實(shí)際。
如果你要學(xué)萬(wàn)能的程序語(yǔ)言,那Python是最適合。它功能強(qiáng)大目的性強(qiáng),很受歡迎。
我發(fā)現(xiàn)Python是一種極易上手且多用途的編程語(yǔ)言。但實(shí)際上,如果你要做的是探索和可視化數(shù)據(jù),它會(huì)讓你覺(jué)得吃力:例如Youtube就是用Python開(kāi)發(fā)的……代碼有一百萬(wàn)行。如果你想了解Python,Code Academy 課程是一個(gè)短且有趣的語(yǔ)言介紹。
最后,和前面介紹的D3.js , Javascript or ggplot ,R一樣, Python也有很多資料庫(kù)。最值得推薦的是,Seaborn(建立在一個(gè)年長(zhǎng)受歡迎的庫(kù),matplotlib)和Bokeh很有可能是一流的,但是這是一個(gè)快速發(fā)展和提升的領(lǐng)域。Seaborn and Bokeh 的網(wǎng)站包括畫(huà)廊展示你用這些工具創(chuàng)建的各種各樣的可視化作品。
??!太多太多!祝您愉快–如果你創(chuàng)造了一些有趣的東西,請(qǐng)聯(lián)系我:在Twitter上@uptownnickbrown或者發(fā)我的郵箱nick@quanticle.co
原文連接:Getting into data visualization?—?where should I start?
作者:Nick Brown 本文由Teradata挖掘顧問(wèn)肖小花翻譯,轉(zhuǎn)載自36大數(shù)據(jù)
聯(lián)系客服