非編程篇/可直接上手的工具

1.Excel

Excel是最容易上手的圖表工具,善於處理快速少量的數據。結合數據透視表,VBA語言,可製作高大上的可視化分析和dashboard儀表盤。


實現數據可視化的幾個工具,你會怎麼選?


單表或單圖用Excel製作是不二法則,它能快速地展現結果。但是越到複雜的報表,excel無論在模板製作還是數據計算性能上都稍顯不足,任何大型的企業也不會用Excel作爲數據分析的主要工具。

2.可視化 BI(Power BI \Tableau \ 帆軟FineBI等等)

也許是Excel也意識到自己在數據分析領域的限制和眼下自助分析的趨勢,微軟在近幾年推出了BI工具Power BI。同可視化工具Tableau和國內帆軟的BI工具一樣,封裝了所有可能分析操作的編程代碼,操作上都是以點擊和拖拽來實現,幾款工具的定位稍有不同。

Power BI

最大的明顯是提供了可交互、鑽取的儀錶板,利用Power Pivot可直接生產數據透視報告,省去了數據透視表。


實現數據可視化的幾個工具,你會怎麼選?


Tableau

可視化圖表較爲豐富,堪稱一等, 操作更爲簡單。


實現數據可視化的幾個工具,你會怎麼選?


帆軟FineBI

企業級的BI應用,實用性較強,因2B市場的大熱受到關注。千萬億級的數據性能可以得到保證,業務屬性較重,能與各類業務掛鉤。

對於個人,上手簡單,可以騰出更多的時間去學習業務邏輯的分析。


實現數據可視化的幾個工具,你會怎麼選?


編程篇

對於尋求更高境界數據分析師或數據科學家,如果掌握可視化的編程技巧,就可以利用數據做更多的事情。熟練掌握一些編程技巧,賦予數據分析工作更加靈活的能力,各種類型的數據都能適應。大多數設計新穎、令人驚豔的數據圖幾乎都可以通過代碼或繪圖軟件來實現。

與任何語言一樣,你不可能立刻就開始進行對話。要從基礎開始,然後逐步建立自己的學習方式。很可能在你意識到之前,你就已經開始寫代碼了。關於編程最酷的事情在於,一旦你掌握了一門語言,學習其他語言就會更加容易,因爲它們的邏輯思路是共通的。

1. Python語言

Python 語言最大的優點在於善於處理大批量的數據,性能良好不會造成宕機。尤其適合繁雜的計算和分析工作,而且,Python的語法乾淨易讀,可以利用很多模塊來創建數據圖形比較受IT人員的歡迎。


實現數據可視化的幾個工具,你會怎麼選?


利用 Python 生成的圖表

2. PHP語言

PHP這個語言鬆散卻很有調理,用好了功能很強大。在數據分析領域可以用php做爬蟲,爬取和分析百萬級別的網頁數據,也可與Hadoop結合做大數據量的統計分析。

因爲大部分 Web 服務器都事先安裝了 PHP 的開源軟件,省去了部署之類的工作,可直接上手寫。

比如 Sparkline(微線表)庫,它能讓你在文本中嵌入小字號的微型圖表,或者在數字表格中添加視覺元素,就像下面這張圖一樣:


實現數據可視化的幾個工具,你會怎麼選?


利用 PHP 圖形函數庫生成的微線表

一般 PHP會和 MySQL 數據庫結合使用,這使它能物盡其用,處理大型的數據集。

3.HTML、JavaScript 和 CSS語言

很多可視化軟件都是基於web端的,可視化的開發,這幾類語言功不可沒。而且隨着人們對瀏覽器工作越來越多的依賴,Web 瀏覽器的功能也越來越完善,藉助 HTML、JavaScript 和 CSS,可直接運行可視化展現的程序。


實現數據可視化的幾個工具,你會怎麼選?


實現數據可視化的幾個工具,你會怎麼選?


可交互日曆,同時也是用戶使用 your.flowingdata 的熱度圖

不過還是有幾點需要注意。由於相關的軟件和技術還比較新,在不同瀏覽器中你的設計可能在顯示上會有所差別。在 Internet Explorer 6 這類老舊的瀏覽器中,有些工具可能無法正常運行。比如一些銀行單位仍舊使用着IE,無論是自己使用還是開發的時候都要考慮這樣的問題。

4.R語言

R語言是絕大多數統計學家最中意的分析軟件,開源免費,圖形功能很強大。

談到R語言的歷史,它是專爲數據分析而設計的,面向的也是統計學家,數據科學家。但是由於數據分析越來越熱門,R語言的使用也不瘦那麼多限制了。

R的使用流程很簡潔,支持 R 的工具包也有很多,只需把數據載入到 R 裏面,寫一兩行代碼就可以創建出數據圖形。比如利用 Portfolio 工具包快速創建出如下的板塊層級圖。


實現數據可視化的幾個工具,你會怎麼選?


實現數據可視化的幾個工具,你會怎麼選?


R 生成的熱度圖

當然還有很多傳統的統計圖表。

相關文章