工作3年,可视化毫无进步?小白都能看懂的干货,我真不想告诉你
不論是在數(shù)據(jù)可視化,還是任何項(xiàng)目中,搞清楚做這件事情的目的都是最重要的。
數(shù)據(jù)可視化的目標(biāo),首先在于做數(shù)據(jù)的目的,數(shù)據(jù)的目的在于“準(zhǔn)確”、“清晰”的展示清楚一件事情的原貌。但數(shù)字本身是枯燥的,傳統(tǒng)意義上使用表格來(lái)展示數(shù)據(jù),雖然能夠清晰展示一件事情的全貌,但它是不直觀的,需要花費(fèi)使用者一定的時(shí)間與精力來(lái)解讀。
因此,數(shù)據(jù)可視化天然的帶有三項(xiàng)目標(biāo):
- 準(zhǔn)確:精確的展示數(shù)據(jù)的特征,既不能遺漏,也不能冗余;
- 清晰:理解清楚數(shù)據(jù)目的信息,時(shí)間越短越好;
- 優(yōu)雅:通過(guò)美觀而又協(xié)調(diào)的頁(yè)面,讓使用者的注意力盡可能多的留在頁(yè)面上。
相對(duì)而言,準(zhǔn)確>清晰>優(yōu)雅,我們應(yīng)該盡可能多的向這三個(gè)目標(biāo)靠攏。
怎樣的數(shù)據(jù)可視化是好看的
就像數(shù)據(jù)有質(zhì)量和安全的原則一樣,數(shù)據(jù)可視化也有它自身的設(shè)計(jì)原則。雖然在平面設(shè)計(jì)上有許許多多設(shè)計(jì)的原則或者技巧,但在數(shù)據(jù)可視化的項(xiàng)目中,最重要的只有一種:認(rèn)知負(fù)荷,重點(diǎn)在于如何快速的傳遞有效信息。
在認(rèn)知負(fù)荷理論中,會(huì)假設(shè)人類(lèi)的認(rèn)知結(jié)構(gòu)由短時(shí)記憶和長(zhǎng)時(shí)記憶組成,短時(shí)記憶一次只能處理2-3條信息,因此假設(shè)數(shù)據(jù)圖表冗余的信息過(guò)多,短時(shí)記憶是無(wú)法很快處理完的,白白浪費(fèi)了最寶貴視覺(jué)通道。例如當(dāng)你第一次看到下圖時(shí),腦袋是非常大的:
?
或者像下圖這樣,顏色沒(méi)有表示任何信息,會(huì)浪費(fèi)看圖人的感情:
?
為了解決圖標(biāo)冗余的問(wèn)題,我們會(huì)通過(guò)格式塔原理來(lái)優(yōu)化圖表,減輕看圖人的視覺(jué)負(fù)擔(dān)。完整的原理一共有八項(xiàng),但我們這里介紹最重要的幾個(gè)原則:臨近、相似和閉合。
臨近原則:簡(jiǎn)單說(shuō),當(dāng)你看到相互鄰近的兩個(gè)元素時(shí),你通常傾向于它們是一個(gè)整體,例如你看到下方左圖時(shí),你會(huì)很自然的將臨近的三個(gè)格子看成是一組,再通過(guò)顏色區(qū)分,就可以很清楚的理解圖表所表達(dá)的涵義。
但如果看右邊的圖,柱子間距是等寬的,你就會(huì)產(chǎn)生非常多的困惑。事實(shí)上,我們很多的圖標(biāo)插件,都是默認(rèn)等寬的,在顯示數(shù)據(jù)的時(shí)候,你只要調(diào)整一點(diǎn)點(diǎn),視覺(jué)上就會(huì)美觀很多,它就是一個(gè)好的數(shù)據(jù)可視化圖表。
?
相似原則:簡(jiǎn)單說(shuō),人在視覺(jué)上,通常是將顏色相近,或者是形象類(lèi)似的元素,當(dāng)成是一個(gè)整體。例如下面的圖片中,你會(huì)很自然的將元素進(jìn)行分組。
?
因此,我們?cè)诔尸F(xiàn)折線(xiàn)圖時(shí),如果將曲線(xiàn)的顏色進(jìn)行區(qū)分,配合高亮的文字說(shuō)明,會(huì)讓讀者產(chǎn)生非常直觀的印象。就像下圖這樣:
?
閉合原則:簡(jiǎn)單說(shuō),如果我們將一組元素圈起來(lái),人們就傾向于這組元素是一個(gè)整體。像下圖一樣,不論是用線(xiàn)條勾勒出來(lái),還是用色塊襯托出來(lái),你都會(huì)認(rèn)為這是一個(gè)整體。
?
同樣的,我們將剛才的圖稍稍改造一下,加上色塊的襯托,內(nèi)容看起來(lái)就更豐富了,并且不會(huì)讓人產(chǎn)生困惑。
?
數(shù)據(jù)可視化的常用工具
“工欲善其事,必先利其器。”即便我們腦中有了清晰的表達(dá)方式,但如果沒(méi)有合適的工具,還是無(wú)法完成數(shù)據(jù)可視化的宏圖大業(yè)。一般來(lái)說(shuō),我們有四類(lèi)工具,可以幫助我們來(lái)實(shí)現(xiàn)數(shù)據(jù)可視化。
- 第一類(lèi)是專(zhuān)業(yè)的繪圖軟件,例如PS、AI等,設(shè)計(jì)師小伙伴們會(huì)很熟悉,我們可以把數(shù)據(jù)做成大概的樣子,交給設(shè)計(jì)師幫忙進(jìn)行美化,做成海報(bào)、新聞稿的樣子,但這種方式非常的偏重具體結(jié)論,很難復(fù)用。
- 第二類(lèi)是圖表插件,像大名鼎鼎的Echarts,再例如Highcharts、AntV等,主要通過(guò)JS來(lái)控制插件的展示方式,在前端頁(yè)面中非常常用。有能力的公司,也會(huì)開(kāi)發(fā)一些特有的可視化控件,用于支持自身的業(yè)務(wù)。但這種方式開(kāi)發(fā)過(guò)程比較繁瑣,通過(guò)調(diào)整一個(gè)美觀的樣式需要非常長(zhǎng)的時(shí)間。
- 第三類(lèi)是一些圖表工具,例如最簡(jiǎn)單的Excel、PPT,FineBI等工具,這類(lèi)工具傾向于個(gè)人使用,在匯報(bào)工作、整理思路的時(shí)候非常好用。
- ?
- 第四類(lèi)就是一些編程語(yǔ)言了,例如Python和R都有自己的可視化包,只是實(shí)現(xiàn)起來(lái)比較的難,但數(shù)據(jù)挖掘的同學(xué)就相對(duì)常用一些了。
?
如何開(kāi)展數(shù)據(jù)可視化工作
開(kāi)展數(shù)據(jù)可視化工作前,首先要搞清楚我們做數(shù)據(jù)可視化的方向是什么,一般來(lái)說(shuō)有兩個(gè)方向,一種是解釋型,體現(xiàn)已知數(shù)據(jù)傳遞的特征價(jià)值,并追求細(xì)膩的表達(dá)方式;一種是探索型,對(duì)于未知數(shù)據(jù)的價(jià)值進(jìn)行探索,支持高效的數(shù)據(jù)交互方式。
通常情況下我們做匯報(bào),都是用的解釋型,而少數(shù)場(chǎng)景,例如分析交易數(shù)據(jù)中存在哪些商機(jī)時(shí),會(huì)使用到探索型方式。
在此基礎(chǔ)上,我們?cè)倥袛嘁幌率褂媚姆N圖表類(lèi)型更合適一些。如下圖:
?
再或者是英國(guó)金融時(shí)報(bào)雜志的建議:
?
接下來(lái),我們就開(kāi)展工作了,通常分為三個(gè)步驟:
- 第一步,加工需要展示的數(shù)據(jù)信息,并存到指定的系統(tǒng)上;
- 第二步,選擇合適的可視化工具,及展示的圖表樣式;
- 第三步,將數(shù)據(jù)圖表實(shí)現(xiàn)出來(lái),并進(jìn)行細(xì)節(jié)上的優(yōu)化調(diào)整。
這里重點(diǎn)說(shuō)明一下優(yōu)化調(diào)整部分,最重要的就是理解視覺(jué)編碼及視覺(jué)通道的概念。簡(jiǎn)單說(shuō),就是把人的大腦看作是計(jì)算機(jī),你需要將圖表進(jìn)行編碼加工,送到人的視覺(jué)系統(tǒng)里,并由人腦進(jìn)行解碼。如下圖所示:
?
其實(shí)對(duì)于數(shù)據(jù)同學(xué)來(lái)說(shuō),自行調(diào)整圖表樣式會(huì)走很多的彎路,而我們要做的,就是征求設(shè)計(jì)師的意見(jiàn),將圖表一些表達(dá)形態(tài)固定下來(lái),避免自己亂造輪子。很多設(shè)計(jì)師同學(xué)會(huì)給出自己的建議,例如:
1.常規(guī)圖表不要使用3D效果,體積嚴(yán)重影響人類(lèi)感知的精確性;
2.長(zhǎng)度是最好的表達(dá)柱狀圖方式,長(zhǎng)度與感知是線(xiàn)性關(guān)聯(lián)的,如下圖,左邊看起來(lái)要比右邊舒服的多:
?
3.盡量不要過(guò)度使用圓角,這樣會(huì)損耗數(shù)據(jù)的精確性。
假設(shè)沒(méi)有設(shè)計(jì)師同學(xué)的幫忙,我們也可以自己總結(jié)一些常規(guī)的經(jīng)驗(yàn),例如在數(shù)倉(cāng)最常用的維度建模中,如何調(diào)整維度數(shù)據(jù)與度量數(shù)據(jù)的關(guān)系,就可以通過(guò)下圖調(diào)整:
?
最后,數(shù)據(jù)可視化是一門(mén)實(shí)踐科學(xué),與研發(fā)有固定的框架和模式不同,很多效果只有通過(guò)實(shí)踐才能得出道理。這就有點(diǎn)像技術(shù)和業(yè)務(wù)的關(guān)系,盡管技術(shù)是每個(gè)人都追求的最高境界,但沒(méi)有業(yè)務(wù)的幫忙,技術(shù)就難以產(chǎn)生真正的商業(yè)價(jià)值。
?
歡迎關(guān)注我的公眾號(hào)“商業(yè)智能研究”,私信回復(fù)“資料包”,即可領(lǐng)取大數(shù)據(jù)、數(shù)據(jù)中臺(tái)、商業(yè)智能、數(shù)據(jù)倉(cāng)庫(kù)等6G精華資料!
?
?
?
總結(jié)
以上是生活随笔為你收集整理的工作3年,可视化毫无进步?小白都能看懂的干货,我真不想告诉你的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 以前的报表都白做了!app上做可视化数据
- 下一篇: 程序员对学历高吗?毕业是考研还是实习?