謝謝邀請!

數據分析師通常分成兩種,一種是應用級數據分析師,另一種是研發級數據分析師,區別就在於是否具備演算法設計及實現的能力。

應用級數據分析師通常需要掌握各種數據分析工具,把業務模型映射到數據分析工具上,從而得到數據分析的結果。數據分析工具比較多,比如Excel就是一個傳統的數據分析工具,另外還有Minitab、LINGO、JMP等,要想全面掌握這些工具的使用需要具備一定的數學基礎和統計學基礎。通常做BI的數據分析師還需要進一步掌握資料庫的基礎知識,但是難度往往並不大。

研發級數據分析師就需要掌握編程知識了,在數據分析領域R、Python、C、MATLAB等語言都有廣泛的應用,目前通過Python等語言來完成數據分析也是一個比較常見的做法。其實MATLAB也是一個在數據分析領域佔據重要位置的軟體(語言),MATLAB功能非常強大。

在大數據時代,通過機器學習的方式實現數據分析是一個比較常見的方式,而Python語言則是一個比較常見的選擇,一方面Python語言簡單易學,另一方面Python語言具備豐富的庫支持,比如Numpy、Scipy、Matplotlib、Sympy、pandas等都是比較常見的庫,這些庫的使用會極大的降低演算法實現的難度。

總之,對於數據分析師來說,如果想在數據分析的道路上走的更遠,編程是一定要掌握的,其實編程語言本身並不是數據分析環節中的難點,比如學習Python還是一個比較輕鬆的過程。

對於基礎比較薄弱的學習者來說,從使用工具開始學習數據分析是一個比較現實的選擇。

作者簡介:中國科學院大學計算機專業研究生導師,從事IT行業多年,研究方向包括動態軟體體系結構、大數據、人工智慧相關領域,有多年的一線研發經驗。

歡迎關注作者,歡迎諮詢計算機相關問題。


首先來回答你的第一個問題:做數據分析一定要懂編程語言嗎?答:數據分析師立足的根本就是要有數據可分析,要會分析的方法。目前而言,數據體量在不斷的增加,以往512MB存儲空間我們都會覺得很大了,現在呢?存儲空間都是上T級或者更高級。如果你需要分析的數據過多,如何從海量數據中找到有效數據剔除無用數據?僅憑肉眼或者模式單一的軟體是不可取的,比如你可以通過自己搭建網路爬蟲獲取自己想要的數據,利用Python庫從海量數據中找出有用的數據,所以不是一定要懂編程語言,而是懂了並無害處。

第二個問題:不懂代碼也是可以做數據分析的,但是前提是你要有數據,懂數據背後的含義,採用合適的方法去做數據分析,找出數據背後蘊含的含義。第一個問題和第二個問題舉例子來講,如果你不會廚藝,那你也可以開飯館,但是需要你僱廚師。但是如果你本身就是廚師,那你就不需要僱。同樣道理,數據分析不會編程,只要有數據就可以做,但是如果你會編程並沒有害處呀!

第三個問題:

目前數據分析工具很多,下面列舉幾種常見的:

1、Excel

在很多企業的數據分析中,常用的是Excel。在Excel,需要重點瞭解數據處理的重要技巧及函數的應用,特別是數據清理技術的應用。這項運用能對數據去偽存真,掌握數據主動權,全面掌控數據;Excel數據透視表的應用重在挖掘隱藏的數據價值,輕鬆整合海量數據:各種圖表類型的製作技巧及Power Query、Power Pivot的應用可展現數據可視化效果,讓數據說話。因此想從事數據分析崗位的,需要快速掌握快各種Excel數據處理與分析技巧。

2、SPSS

是用於統計學分析運算、數據挖掘、預測分析和決策支持任務的軟體產品及相關服務的一款軟體集合,能夠進行多種統計分析

3、R語言

R語言是一種環境,通過支持多種多樣的包,可以完成爬蟲、數據清洗、數據分析的功能。

4、Python

也是目前很火的用於數據分析的環境,其中多個包在大數據分析中功能強大。Numpy是Python科學計算基礎包;pandas能夠讓我們處理結構化數據的大量數據結構和函數;matplotlib是最流行的用於繪製數據圖表的python庫等等。

最後一個問題:

數據分析是把數據變成信息的工具,數據挖掘是把信息變成認知的工具,數據分析是側重於對已有數據的展示,而數據挖掘是從已有數據中找尋規律。


獨立的數據分析師,不懂代碼理論上有可能(比如給你配了程序員,你負責提需求),但實際不太可能存在。

但如果是個數據分析團隊,裡面可以有不懂編程的人,比如團隊的老大。

我本人是做數據分析的,帶一個團隊,負責數據架構的搭建 指標體系建立及計算 監控分析與運營 數據質量 數據安全等等。我會編程,但我認為我的boss纔是一流的數據分析師,儘快他不懂任何程序,但他總能根據我做的報告提出好的問題。

個人認為:提出好的問題是數據分析是天職。

數據分析師是要能用數據去描述業務,並能通過數據發現業務中存在的問題。你可以不懂編程,但你一定要理解數據圖表 會設計指標,並能和業務關聯起來。

數據挖掘通常面臨的問題比較明確,是用數據建模的方法去解決明確的問題。

很多公司這兩個崗位是統一的,但我個人認為還是有區別的,而且最好區分開。按照我的設計,數據分析是數據挖掘的前手,好處有很多,主要是管理上的,避免部分員工過於核心,否則離職了你很麻煩。

至於工具,如果沒有編程基礎,我覺得那些統計軟體根本不適合你,你需要的是BI工具。

推薦一個收費的,tableau。一般用用excel也不錯。


數據分析師最好要會一門編程語言。

我們可以把問題反過來思考,如果數據分析師不會寫代碼,會怎樣?

第一,不會寫代碼,就不會在後臺資料庫中怎麼查詢數據看到最真實的數據;

第二,不會寫代碼,就需要告訴IT人員怎麼計算好所需要的分析指標,這過程中IT人員常常算錯,或者算出來的數據不是想要的結果,而且增加了溝通成本、時間成本;

第三,一些數據處理的操作,用EXCEL來做不是很好做,用代碼處理非常高效;

而且,會編程,也多了一項技能,讓自己在工作中多一些項目機會,這不是很好麼?

數據分析工具,一般會用SQL、python、R、EXCEL,還有一些BI工具,如Tableau。

要把視野擴大一點,數據分析的範疇可以很大,本質上講,數據分析就是分析數據以推動解決實際問題。數據挖掘,即用演算法建立模型,也是數據分析的工作。


肯定的回答:需要

數據分析師通常會提供sql去提取數據,進行分析處理出報表,少量數據通常用Excel,大量複雜數據就需要編程能力,使用代碼來解決處理,如果分析師不懂編程必然會縮手縮腳的,提高不了自己的工作效率

分析師通常需要出一下自動化報表,這些功能如果會具有編程能力的話,那就手到擒來來,現在大部分公司都分析師除了sql,普遍都需要python數據分析處理能力

分析師工作常常涉及用戶畫像,數據挖掘,用戶標籤等等,這些功能都需要編程能力來輔助


做數據分析最重要的基本技能是數據意識,非數據處理的編程能力:

1、對數據敏感纔有發現數據背後管理意義的意識,無論什麼行業,數據存在每個流轉,每次交互,每次沉澱的節點,當你具備對這些數據的解讀能力,對數據與數據之間的關係有足夠的敏感認知時,就能發現並發掘出數據背後呈現的問題;

2、對數理有基本知識,對數據組合計算後代表的意義有挖掘能力,將具備用數據說話的能力;

3、對數據組合驗證有邏輯判斷能力,現在數據信息泛濫,被污染的數據也不少,需要分析師有一定的判斷能力和識別能力,能夠在不同數據源中快速定位有價值的數據信息,清洗幹擾數據;

如上三個能力都需要豐富的工作經驗和數據統計能力,數據再生能力遠比編程能力更具備競爭力和發展空間。


最好還是要有一些編程的基礎會比較好。雖然用sap等強大的工具已經可以完成很多業務,但是如果面對更加複雜的業務的話,編寫代碼還是少不了的。 只不過數據分析師,不用像程序員那天天天沉浸在代碼中罷了。

數據分析工具我認為用的最多的就是spa了。

數據分析師和數據挖掘都需要對業務熟悉,不同的是數據挖掘的崗位在目前業界裡面要求技術能力更強一些。 不過兩者的界限也越來越模糊了。

我是coder李,歡迎關注我!


數據分析不一定要懂編程,數據分析需要懂數據分析的理論知識,也需要精通業務知識。現在很多分析工具都可以選擇。

DataViz數據可視化分析工具是在線數據分析軟體(BI),無需數據分析師和IT人員的幫助,業務人員只需通過拖拽式操作即可完成數據可視化分析工作。支持拖拽數據集中維度和度量即可自動實現可視化展現以及數據透視功能,支持數十種圖表自由切換。支持連接各種業務資料庫如Oracle、 MySQL、 SQL Server等、文本數據源如Excel、 Csv等。可以訪問東軟平臺雲(https://cloud.neusoft.com)直接註冊訪問。


不一定需要,但需要什麼時候提供什麼樣的數據服務。


編程那是必須的


推薦閱讀:
相關文章