有大牛可以通俗的解釋一下嗎


數據可視化,不是簡簡單單把數據變成圖形這麼簡單!

通俗來說,圖形只是數據可視化的一種方法,數據可視化真正的含義更類似於「翻譯」,是將我們看不懂的數據通過圖形化的手段進行有效地表達,準確高效、簡潔全面地傳遞某種信息,甚至我們幫助發現某種規律和特徵。

就好比我們看原著《哈姆雷特》,普通人很難接收到作者在書中向我們表達的內容,所以就需要翻譯對原著進行解釋,首先翻譯成我們看的懂的語言、準確表達作者的觀點(準確表達),最後能幫助我們理解、讀懂這本著作(數據挖掘)。

什麼是數據可視化?

數據是最原始的孤立符號,如何將數據轉化成有意義、有價值、有聯繫的信息,就需要進行數據表達。

比如說,有的人可以在短時間內記住成百上千個毫無規律的手機號碼,其實沒有什麼奧秘,只是因為他們通過數據表達將原本毫無意義的符號,變成了有聯繫的圖形信息。

比如他們在記憶183492761這樣的數字時,會將數字放入到類似於手機解鎖的九宮格中,這樣他們就能將記憶數字改變為記憶圖形,會大大提高記憶效果。

這是為什麼呢?其實是因為人類右腦記憶圖像的速度比左腦記憶抽象的文字快100萬倍。因此,數據可視化能夠加深和強化受眾對於數據的理解和記憶。

舉個更為實際點的例子,通常很多人做報表時都會給老闆這樣的表格:

這種excel表格的方式僅僅是將數據進行了羅列,沒有辦法表達出真正的主體信息,老闆也沒辦法從這樣的數據中找出什麼規律和特徵;相反的,如果你利用數據可視化將數據轉化成這樣的形式,老闆獲取信息的效率會更快,也能從數據中找出事物變化的趨勢與規律,幫助老闆進行決策。

二、可視化的原則

一是平衡性。

在可視化規範與領導喜好之間尋求平衡點。大名鼎鼎的IBCS建立了關於報表、幻燈片、儀錶板、圖和表的製作標準,就像下圖這樣。

有了這些視化規範是不是直接參照就可以呢?還不行,還需要加入一些「中國特色」,也就是領導的喜好,否則可能水土不服。如何把握領導的喜好?作為一個數據分析師,這應該是一個基本功吧。

二是邏輯性。

一個好的分析師會用數據講故事,數據可視化之後故事會更吸引人,好的可視化就是與數據的邏輯完全契合,想展示什麼(數據背後的含義)——依據是什麼(數據的趨勢變化)——結論是什麼(數據反映的問題)。

三是準確性。

可視化要忠於數據,刻意誇大或者美化數據及變化都不可取。舉個例子,前一段幫一個朋友做可視化,數據在1-50之間,做成的蝴蝶圖中「數據1」對應的條形幾乎不可見,這時候朋友就不滿意了,明明有數圖中卻看不見這必須得改,接著又拒絕我增加「折斷」的想法,萬般無奈之下被逼著將「1」改成了「2」,終於露出一個「尖尖角」。一聲長嘆,數據可視化時既要滿足甲方需求,也要儘可能地堅持原則。

四是穩定性。

剛才在談可視化的誤區時,建議大家不要過於求新求變,不要執著於某一類可視化類型,而是應該保持穩定性,通過增加細節適度微創新,還是領導熟悉的味道只是加了點料,保持了可視化風格延續的同時又有一點小驚喜。比如增加標準線,增加差異箭頭、增加區域分隔等等。

三、可視化都哪些好用的工具?

常用的可視化工具主要有這4類:

一是在線可視化工具。

主要有鏑數、花火等,優點是圖表種類豐富、類型新穎、配色年輕化,還提供了一些十分酷炫動態圖表,操作也比較簡單,很多新媒體都在用,缺點是數據保密性不夠。

二是編程可視化工具。

主要有E-charts、D3、ggplot、Matplotlib、pandas、plt等,優點是可以製作大型數據集和交互動畫的圖表,高端大氣上檔次,可視化效果跟腦洞大小呈正比,缺點是需要有編程基礎,門檻較高。

三是商業智能工具。

比如國內比較有有名的FineBI等,是專業的大數據 BI 和分析平台,主要為企業提供一站式商業智能解決方案,用他們做數據分析和可視化駕駛艙真是妥妥的,不需要寫代碼,而且操作比較方便,缺點是目前市場上的大部分BI都收費,不過FineBI個人版免費,這一點算是很人性化的

四是基礎可視化工具。

主要就是Excel,優點是通用、易用、實用,傻瓜式操作,基本上人人都會,使用成本較低,同時還有基於excel開發的圖表插件Thinkcell Chart、Zebra Bi,國內可視化大神Peter開發的Easyshu,可以高效地製作出商業圖表。缺點是Excel本身主要製作常規性的圖表,很多特殊圖表無法實現,功能強大的圖表插件價格不菲。

山不在高有仙則名,水不在深有龍則靈。工具沒有好壞,也不是越多越好,好用趁手就行,對於我個人來說這4類可視化工具各有特色,但要說最容易上手,最適合入門,適合大部分人日常需求的工具,非Excel莫屬。

發佈於 2020-06-01繼續瀏覽內容知乎發現更大的世界打開Chrome繼續桑文鋒桑文鋒神策數據創始人兼CEO,前百度大數據部技術經理。

就是把數據做一些展現,在展現的時候,要突出要表達的重點。你在網上看到的各種圖表,都是數據可視化。數據可視化一般也需要考慮的是數據的處理,就是把數據準備好,存放到合適的位置,如資料庫等,方便展現是讀取。


就是把數據做一些展現,在展現的時候,要突出要表達的重點。你在網上看到的各種圖表,都是數據可視化。數據可視化一般也需要考慮的是數據的處理,就是把數據準備好,存放到合適的位置,如資料庫等,方便展現是讀取。


推薦閱讀:
相关文章