可視化有許多“規(guī)則”。有的是實(shí)際的規(guī)則,有的則是幫助你做出選擇的建議。如果是出于數(shù)據(jù)的要求,而且你也知道該怎么做,那么許多實(shí)際的規(guī)則也不必遵守。
但是,的確有一些規(guī)則不應(yīng)該違背。這些規(guī)則通常是用于一些特定種類、幾乎只能用特定方式閱讀的圖表。當(dāng)這些規(guī)則被打破,閱讀過(guò)程中,數(shù)據(jù)有可能被誤讀。這會(huì)有點(diǎn)棘手。
條形圖的基線必須從零開(kāi)始
條形圖依賴長(zhǎng)度來(lái)呈現(xiàn)數(shù)據(jù)。短的條塊代表較低的值,長(zhǎng)一些的則表示較高的值。條形圖的原理就是通過(guò)比較條塊的長(zhǎng)度來(lái)比較值的大小。
當(dāng)基線被改變了,視覺(jué)效果也就扭曲了。
舉例來(lái)說(shuō),請(qǐng)看上圖。左邊第一幅條形圖比較了兩個(gè)值:50和100,它有一條并且它有一條以零為起點(diǎn)的基線。很好。代表數(shù)值100的條塊長(zhǎng)度正好是數(shù)值50的兩倍長(zhǎng),為100正好也是50的兩倍大小。
但當(dāng)你把基線變?yōu)橐粋€(gè)更高的、非零的值時(shí),第一個(gè)條形的長(zhǎng)度變短了,而另外一個(gè)條形的長(zhǎng)度卻沒(méi)有變。此時(shí)值為100的條形不再是值為50的條形的兩倍長(zhǎng)。以此類推,當(dāng)最后左邊代表數(shù)值50的條形徹底消失了,意味著100無(wú)限地大于50了。
條形圖的基線必須從零開(kāi)始。
例:這張條形圖是經(jīng)??怂剐侣劀?zhǔn)許使用的。
3月31日目標(biāo)的值為7,066,000,比6,000,000高17.8%,然而第二個(gè)條形幾乎是第一個(gè)條形長(zhǎng)度的三倍。
有人也許會(huì)反駁說(shuō),這張圖的重點(diǎn)在于兩個(gè)值的差而非這兩個(gè)值本身。即便如此,用條形圖來(lái)表示本身就是一個(gè)錯(cuò)誤的選擇。使用時(shí)間序列來(lái)呈現(xiàn)月累積數(shù)也許會(huì)更好。
不要過(guò)分熱衷于餅圖
有些人認(rèn)為,應(yīng)該完全避免餅圖。他們也許是對(duì)的,也許又不是。有些人也許會(huì)說(shuō),使用餅圖完全是一種不可原諒的錯(cuò)誤。對(duì)此,我不同意。不管怎樣,事實(shí)情況是人們?nèi)匀皇褂蔑瀳D,所以我們至少可以爭(zhēng)取正確地使用它們。
避免過(guò)度切割餅圖,否則最終對(duì)它的閱讀將難以為繼。
那么多少是“太多”?這是一個(gè)判斷力的問(wèn)題。不過(guò),如果已經(jīng)很難從圖中看出其中一塊扇形是另一塊兩倍大,或者好幾個(gè)較小的扇形區(qū)域看起來(lái)差不多大時(shí),在扇形切割上面就該收手了。此時(shí)可以考慮把較小的類目歸入一個(gè)更大的:“其他”。圓環(huán)圖也是一樣。
同時(shí)也考慮一下用其他種類的圖表來(lái)表示比例。
不要太依賴于餅圖。
例:這張餅圖來(lái)自維基百科,它展示了國(guó)家的不同區(qū)域。
左邊這張餅圖中已經(jīng)切割了許多塊,但旁邊另分離出一張餅圖,顯示了左圖中看不清楚的更小國(guó)家的情況,以此來(lái)提供更多的信息。有許多方式可以展示這組數(shù)據(jù),比如樹(shù)狀圖、按照數(shù)據(jù)比例制作的圖標(biāo),或者就用普通的地圖。單薄的餅圖只適用于顯示只有幾組值的數(shù)據(jù)。
尊重部分所占整體的比例
相較于呈現(xiàn)數(shù)值,有些圖更著重于表現(xiàn)部分與整體的關(guān)系,它們表現(xiàn)的數(shù)據(jù)是部分所占整體比例。比如,堆積式條形圖,堆積區(qū)域圖,樹(shù)狀圖,馬賽克圖,圓環(huán)圖以及餅圖。在這些圖表中,每一個(gè)部分都表示一個(gè)獨(dú)立的、不重疊的比例。
關(guān)于這一條,最常見(jiàn)的錯(cuò)誤發(fā)生在調(diào)查問(wèn)題允許多選時(shí)。比如說(shuō):“你上周使用了哪一種交通工具?可以多選。”這樣的話,在人們多選的問(wèn)題上就會(huì)出現(xiàn)比例的重疊,不同選項(xiàng)的百分比之和大于一。為了避免這種情況,你不能直接把比例做成統(tǒng)計(jì)圖。
例:這張餅圖來(lái)自??怂剐侣勏聦贆C(jī)構(gòu),它表現(xiàn)了三個(gè)不屬于同一個(gè)整體的百分比。
每一個(gè)值都是一個(gè)單獨(dú)的整體,因此在這一例中,用三個(gè)堆積式條塊(或普通的條塊)會(huì)更直觀地表現(xiàn)每個(gè)值的比例。
展示數(shù)據(jù)
讓讀者看到數(shù)據(jù),這是可視化的重點(diǎn)。如果數(shù)據(jù)的呈現(xiàn)不夠清晰,就違背了做圖表的初衷。這常常是因?yàn)橐粡垐D里的數(shù)據(jù)太多,于是讀者的興趣就被分散了。
這是一個(gè)經(jīng)典的“繪圖過(guò)度”的問(wèn)題,相關(guān)的研究有很多。但是對(duì)于基本的圖表,也有一些簡(jiǎn)單的解決方式。
首先是可以改變符號(hào)的大小,這樣上圖中的小圓點(diǎn)(或者是其他的符號(hào))就不會(huì)占據(jù)太多空間。為了讓數(shù)據(jù)直觀清晰,主要要增加空白。
調(diào)節(jié)透明度,多層次的圖案就不會(huì)被覆蓋。
通過(guò)取樣或者把對(duì)數(shù)據(jù)進(jìn)行分類的方式,把總體分成幾個(gè)更小的子群。從中,你可以采取小而多的方式,這樣每張表里的信息就會(huì)少一些。
數(shù)據(jù)進(jìn)行再統(tǒng)計(jì)及分門(mén)別類。
總而言之,更好地呈現(xiàn)數(shù)據(jù)。
例:這張圖展示了金州勇士隊(duì)在2008-09賽季的每個(gè)投籃。
這張圖最終形成了一個(gè)球場(chǎng)的形狀,并得出了對(duì)于球員們投籃最多的地點(diǎn)的一個(gè)小結(jié)論——近框,中距離,以及三分球。但是它們之間的差距是很小的,讀者并不能看清真正量級(jí)上的差距。
數(shù)據(jù)聚合法將有助于解決此類問(wèn)題。
解釋編碼
通過(guò)一定的形狀、顏色和幾何圖形的結(jié)合,將數(shù)據(jù)呈現(xiàn)出來(lái)。為了讓讀者能讀清楚,圖表設(shè)計(jì)者就要把這些圖形解碼回?cái)?shù)據(jù)值。經(jīng)典的例子是沒(méi)有標(biāo)注的坐標(biāo)軸。
有時(shí)編碼不需要解釋。比如說(shuō),讀者也許知道怎樣讀條形圖,就不必解釋條的長(zhǎng)度表示的是值的大小了。但是設(shè)計(jì)者的確應(yīng)該解釋數(shù)據(jù),也就是圖表的單位和主題。
所以標(biāo)明坐標(biāo)軸代表的含義。要給讀者提供線索或圖例,解釋圖表。
例:這個(gè)錯(cuò)誤標(biāo)注的圖表來(lái)自溫尼伯太陽(yáng)報(bào):
我們要是能知道這是統(tǒng)計(jì)關(guān)于什么的問(wèn)題就好了。
2015年數(shù)據(jù)可視化十佳項(xiàng)目
2015 年,優(yōu)秀的可視化作品生機(jī)勃勃,我可以確定,明年也會(huì)有很多好作品。橫跨不同主題和應(yīng)用形式的項(xiàng)目大量涌現(xiàn),但如果讓我選一個(gè)年度主題的話,那一定是“教學(xué)”,不管是通過(guò)解釋說(shuō)明,模擬說(shuō)明還是深刻分析的方式。有時(shí)候會(huì)感到可視化創(chuàng)作者很大膽,試著讓讀者們不再用慣有的思維方式來(lái)理解數(shù)據(jù)和統(tǒng)計(jì)學(xué)。我很喜歡這一點(diǎn)。
以下是我選出的 2015 最佳項(xiàng)目。按照慣例,排名不分先后。同時(shí),也有很多不在這個(gè)名單上的作品,它們同樣很優(yōu)秀。
我們一起來(lái)看看它們。
1.親愛(ài)的數(shù)據(jù)
這是一個(gè)值得跟蹤的有趣項(xiàng)目,它涉及的兩個(gè)話題——可視化和自我監(jiān)測(cè)——引起了我的注意。
親愛(ài)的數(shù)據(jù)是一個(gè) Stefanie Posavec 和 Giorgia Lupi 做的一年項(xiàng)目。每個(gè)人會(huì)追蹤一周中每天發(fā)生的事情,比如每個(gè)人接多少次電話,然后把這些數(shù)據(jù)可視化在一張明信片上。然后他們把這些明信片寄給對(duì)方—— Lupi 現(xiàn)居紐約而 Posavec 住在倫敦。
2.你來(lái)畫(huà):家庭收入如何預(yù)測(cè)孩子的大學(xué)入學(xué)幾率
感覺(jué)今年似乎是挑戰(zhàn)讀者如何在一個(gè)更高的統(tǒng)計(jì)學(xué)視角上理解數(shù)據(jù)的一年。
紐約時(shí)報(bào) Upshot 的 Gregor Aisch, Amanda Cox 和 Kevin Quealy 請(qǐng)讀者畫(huà)一條反映家庭收入和上大學(xué)孩子數(shù)百分比的線。所以你能看到你自己畫(huà)的線,真實(shí)數(shù)據(jù)畫(huà)出的線和其他人是怎么看待這個(gè)關(guān)系的。
關(guān)于Upshot/New York Times 和數(shù)據(jù)假設(shè),參見(jiàn) this quick puzzle to test your pattern-finding ability (快速測(cè)試你的模式識(shí)別能力)和 3-D chart of the economy’s future(經(jīng)濟(jì)未來(lái)發(fā)展3D圖)。
3.“黑”出你的科學(xué)榮耀
紐約時(shí)報(bào)的 538 也通過(guò)他們的可視化互動(dòng)進(jìn)行了一些數(shù)據(jù)科學(xué)教學(xué)活動(dòng)。其中最好的一節(jié)課是教人們?nèi)绾瓮ㄟ^(guò)“竊取 P 值”( p-hacking )來(lái)從同一數(shù)據(jù)集中得到你想要的結(jié)果.
這個(gè)項(xiàng)目發(fā)布的時(shí)候正是一個(gè)剛畢業(yè)的學(xué)生被曝出偽造數(shù)據(jù)的時(shí)候(hyperlink)。Christie Aschwanden和Ritchie King的重點(diǎn)不是懷疑一個(gè)荒唐的結(jié)果是如何通過(guò)了嚴(yán)格的同行評(píng)審的,相反,他們想說(shuō)的是,科學(xué)地做研究并解釋數(shù)據(jù)才是真正的難點(diǎn)。
4.制作歌曲“你現(xiàn)在在哪里”
紐約時(shí)報(bào)的這個(gè)團(tuán)隊(duì)做了一個(gè)有關(guān) Justin Bieber 的訪談,不僅不錯(cuò),還很有趣。
盡管 Bieber 更像一個(gè)配角,因?yàn)?Diplo 和 Skrillex 才是詳盡研究如何制作一首大賣(mài)歌曲的人,但是這個(gè)配在視頻旁邊的音樂(lè)可視化作品可以幫助你更好地理解音樂(lè)家們到底在說(shuō)什么。
5.麻疹如何在接種了疫苗的兒童中傳播及何時(shí)不傳播
衛(wèi)報(bào)的 Rich Harris,Nadja Popovich 和 Kenton Powell 展示了當(dāng)一個(gè)國(guó)家的孩子們不接種麻疹疫苗時(shí)會(huì)發(fā)生什么。
作為父母,我想把這整個(gè)列表做成交互式的。
6.機(jī)器學(xué)習(xí)的可視化介紹
機(jī)器學(xué)習(xí)似乎像一個(gè)有魔力的概念,仿佛意味著一個(gè)機(jī)器人可以不受你的教導(dǎo)去做奇怪的事。Stephanie Yee 和 Tony Chu 對(duì)此用一個(gè)可視化例子進(jìn)行了解謎。
這個(gè)可視化例子如卷軸般帶著你一步一步了解機(jī)器是如何“學(xué)習(xí)”的。過(guò)渡圖表讓整個(gè)圖銜接得非常順暢?,F(xiàn)有成果似乎是一個(gè)系列項(xiàng)目的第一部分,但是我們可能得等一段時(shí)間才能看到后面的。
7.第二次世界大戰(zhàn)的結(jié)束
Neil Halloran 的這個(gè)項(xiàng)目的一部分是記錄,另一部分是交互式可視化,二者無(wú)縫銜接在了一起。
我很驚訝地發(fā)現(xiàn)并沒(méi)有很多人做這個(gè)類型的項(xiàng)目。當(dāng)我意識(shí)到他們?cè)谧鲞@樣一個(gè)項(xiàng)目時(shí),我非常希望這個(gè)能繼續(xù)下去(閱讀更多)。
8. 2014 年是有記錄以來(lái)最熱的一年
最直觀的可視化這類數(shù)據(jù)的方式是單線圖。但把線進(jìn)行分解后,我們可以得到更多的信息。
彭博社的 Tom Randall 和 Blacki Migliozzi 做的這張動(dòng)態(tài)圖展示了月度平均氣溫。每條線代表一個(gè)完整的年份,隨著時(shí)間由遠(yuǎn)到近,這條線在幾英寸幾英寸地升高。
9.網(wǎng)絡(luò)效應(yīng)
距離上一次看到 Jonathan Harris 的這類項(xiàng)目已經(jīng)過(guò)去一段時(shí)間了
他和 Greg Hochmuth 合作了這個(gè)項(xiàng)目,“網(wǎng)絡(luò)效應(yīng)”是對(duì)整個(gè)互聯(lián)網(wǎng)的點(diǎn)評(píng),可以讓人通過(guò)一種奇妙而引人入勝的方式了解互聯(lián)網(wǎng)的方方面面,一次花幾分鐘。
10.常用比喻
“比喻修辭是寫(xiě)作者常用的,在讀者腦海中有特定形象的,一種工具和寫(xiě)作習(xí)慣”。Bocoup 數(shù)據(jù)可視化團(tuán)隊(duì)做的“常用比喻”項(xiàng)目研究了比喻修辭中常用的詞。
如果你想了解電影里的性別角色和人物性格,這個(gè)項(xiàng)目正是你要找的那個(gè)。