1、數(shù)據(jù)可視化概述
1.1、數(shù)據(jù)可視化的作用
數(shù)據(jù)可視化是指將數(shù)據(jù)通過圖表的方式傳遞出來,讓用戶能夠快速、準確地理解信息所要表達的內容,從而提高溝通效率。數(shù)據(jù)可視化的作用主要有:
1)傳遞更多的信息,一張圖能夠傳遞的信息可能需要長篇大論才能寫清楚,如你要描述最近一年公司收入情況,那你就需要說明每個月收入是多少,同比、環(huán)比增幅是多少,收入最多、最少的是哪個月,同比、環(huán)比增幅最低、最高的是哪個月等,而你用圖表表示則只需要一個柱狀圖和折線圖的組合圖表,就能準確表達上面的信息。
2)形象生動,便于理解,圖表通過更簡單的邏輯和視覺體驗,能夠讓用戶快速把握要點,就像前面的例子一樣,通過圖表,我們能夠一眼看哪個月的收入最高,而不用將每個數(shù)字放到大腦中比較,半天都得不出結果。
隨著大數(shù)據(jù)行業(yè)的發(fā)展,用戶對數(shù)據(jù)可視化的要求越來越高,好的可視化能力能夠使用戶更快的理解所要表達的內容,更加形象生動。所謂“字不如表,表不如圖”,圖表的重要性可見一斑,在統(tǒng)計分析產(chǎn)品、用戶畫像等數(shù)據(jù)產(chǎn)品上,都需要具備優(yōu)秀的數(shù)據(jù)可視化能力?,F(xiàn)在常見的如“一圖看懂XXX”等,都是用圖表來傳遞信息,是典型的數(shù)據(jù)可視化成果。
而在企業(yè)生產(chǎn)經(jīng)營過程中常常出現(xiàn)的報表,也不再是原本那樣單一枯燥。就下圖帆軟報表FineReport的可視化來看,報表也可以做得如可視化信息圖一樣直觀易懂。
接下來就來講講常見的可視化圖表,如何做出酷炫的報表!
1.2、圖表的分類
1)趨勢類圖表:通過圖表反映事物發(fā)展趨勢,能夠一眼看清楚走向和大勢,如隨時間變化趨勢,常見圖表為柱形圖、折線圖、面積圖。
2)對比類圖表:通過對比發(fā)現(xiàn)不同事物間的差異和差距,從而總結事物特征,如某兩個人的對比,一個更帥,一個更有錢,常見圖表為雙柱形圖、雙折線圖、雙條形圖、雙面積圖、雷達圖。
3)構成類圖表:通過不同的面積大小、長短等反映事物的結構和組成,從而知道什么是主要的、什么是次要的,常見圖表為餅圖、圓環(huán)圖、樹狀圖、旭日圖、瀑布圖。
4)分布類圖表:通過圖表反映事物的分布、占比情況,從而知道事物的分布特征、不同維度間的關系等,常見圖表為散點圖、直方圖、氣泡圖、詞云、熱力圖。
5)地圖類圖表:通過地圖反映事物地理分布情況或用戶出行軌跡(地圖其實可以算是分布的一種,因為其是一類很重要的可視化圖表,所以單獨列出),常見圖表為全球地圖、中國地圖、省市地圖、街道地圖、地理熱力圖等。
當然,圖表大多都不是單個獨立存在的,而是各類圖表組合在一起的,從而能夠傳遞更多的信息,并能提供一種整合的視角,不用用戶不斷的對比多個圖表,組合圖表是現(xiàn)實中使用得更多的。如既要表達趨勢又要表達構成,則可以使用堆積柱形圖、百分比堆積柱形圖、堆積條形圖、百分比堆積條形圖等;要同時體現(xiàn)絕對值和增長率,則可以使用柱形圖和折線圖的組合圖形;要反映某個構成部分的組成,則可以使用復合餅圖。
1.3、常用圖表
如上所述,圖表主要分為五類,常用的圖表包括柱狀圖、折線圖、餅圖、散點圖、雷達圖等,以下為一些常見的圖表。
1.3.1、柱狀圖
柱狀圖中還包括與其類似的條形圖、瀑布圖、直方圖等,主要是為了反映事物的變化趨勢、分布情況、規(guī)模情況等。
柱狀圖可以按照時間繪制,反映事物變化趨勢,如某個指標最近一年變化趨勢,也可以按照其它維度繪制,如區(qū)域、機型、版本等,反映事物的分布情況。
條形圖是將柱狀圖垂直放置,整體跟柱狀圖差不多,但是換了一個視角。
瀑布圖能夠反映事物從開始到結束經(jīng)歷了什么過程,用于分解問題原因或事物構成因素特別好用,如上月收入是怎么變成本月收入的,就可以通過瀑布圖分解每一個收入組成部分所做的貢獻,找出哪一組成部分提升了收入,哪一組成部分降低了收入。
直方圖反映事物的分布情況,可以看出事物主要集中在哪里,如查看付費用戶付費金額分布等。
1.3.2、折線圖
折線圖是點和線連在一起的圖表,可以反映事物發(fā)展趨勢和分布情況,與柱狀圖相比,更適合代表增幅、增長值,而不太適合代表絕對值。
面積圖就是在折線圖下加上陰影面積,也主要是為了反映事物發(fā)展趨勢和分布情況。
1.3.3、餅圖
餅圖是將一個圓餅分為幾份,用來反映事物的構成情況,類似圖表還包括環(huán)圖、旭日圖等。旭日圖有多個圓環(huán),可以直觀的顯示事物組成部分下一層次的構成情況,比如某個省分為幾個市,每個市下面又有幾個縣、每個縣下面又有幾個鎮(zhèn),就是將事物層層分解。
1.3.4、散點圖
散點圖是事物兩個維度的交叉分布情況,反映不同維度間的關系,如不同產(chǎn)品在市場占有率、預期增長率兩個維度間的分布情況,很多二維矩陣就是通過散點圖來實現(xiàn)的,以兩個維度的平均值作為分割線,如常見的波士頓矩陣。通過散點圖我們可以看出不同事物間是怎么交叉分布的,它們之間有什么關系,是正相關、負相關或隨機分布。
類似的圖表還有氣泡圖,氣泡圖還可以通過氣泡面積的大小表示值的大小,相對于散點圖來說多了一個維度,如前面不同產(chǎn)品的例子,氣泡的大小可以代表各產(chǎn)品營收的多少。
1.3.5、雷達圖
雷達圖主要表達事物在各個維度上的分布情況,從而可以看出事物在什么地方強、什么地方弱。比如一個學生各個學科的得分,就可以通過雷達圖清晰表達出來,用戶能夠一眼看出這個學生哪一科強、哪一科弱,又如一個產(chǎn)品在各個評價維度上的評分。
1.3.6、地圖
地圖可以形象的反映事物在地理上的分布情況以及人員遷徙情況,主要包括地理分布圖(全球、全國、各省市等)、遷徙圖、熱力地圖(省市、街道等)等。
1.3.7、樹狀圖
樹狀圖主要是為了反映事物的構成情況,相對于餅圖的優(yōu)點是,樹狀圖可以更清晰的顯示更多組成部分,比如餅圖可能組成部分多于8個就顯得很擠,而且占比小的就很不清晰,但是樹狀圖卻不會,它能夠充分利用區(qū)域面積。
1.3.8、漏斗圖
漏斗圖主要用來反映關鍵流程各個環(huán)節(jié)轉化情況,讓用戶能夠一眼看清整個流程轉化情況,如常見的電商購物轉化流程,從瀏覽商品-添加進購物車-生成訂單-支付訂單-交易完成等一連串購買流程。下面是手游的轉化漏斗圖,通過分析各個步驟的轉化率,能夠發(fā)現(xiàn)問題所在,找準改進方向。
1.3.9、詞云圖
詞云圖是為了描述事物的主要特征,如一個人主要特征是什么,高、帥、富,或者其它,能夠讓人一眼看出一個事物的主要特征,越明顯的特征越要突出顯示。同時,還有象形的詞云圖,如輪廓是一個人、一只鳥等,用以反映事物主題,從而更加形象生動。
1.3.10、熱力圖
熱力圖主要是反映地理、點擊熱力分布情況,從而看出哪里是人群最多的地方、哪里是用戶點擊最多的地方等,可以反映用戶出行習慣、使用習慣等。
1.3.11、組合圖表
絕大多數(shù)圖表都不是單獨存在的,都是多類型的圖表組合在一起的,這樣才能夠傳遞更多的信息,提供綜合的視角。如我們想看到不同事物間的對比,則我們可以使用雙柱圖、雙折線圖、雙雷達圖、雙環(huán)圖等,可以清晰表達不同事物在不同維度上的對比情況。
1.4、圖表配色
圖表配色在數(shù)據(jù)可視化中是很重要的元素,有了合適的圖表,還要有合適的的配色,才能讓人看著舒服,就像你有一件很有范兒的衣服,還也必須有適合的顏色搭配。恰當?shù)呐渖饕袃蓚€作用:1)突出主題,讓用戶清晰知道圖表主要想要表達的意思,如對重點內容用深色標注;2)讓人看著舒服,整個圖表色彩很和諧,不會讓人感到突兀,如五顏六色的。
圖表配色的原則主要有:
1)圖表配色不能太花,一張圖表超多七種顏色則不是很恰當,容易分散讀者注意力,最好是同一色系的,可以通過調整透明度來設置)。
2)圖表配色要重點突出,想要主要呈現(xiàn)的事物或指標用亮色呈現(xiàn),其它次要事物或指標可以用更淡一些的顏色。
2、數(shù)據(jù)可視化工具
Excel
Excel應該是使用最廣泛的可視化工具,包含基本所有常用的圖表,新版Excel里面有地圖、旭日圖、瀑布圖等。
聯(lián)系客服