分析師,如何出身並不重要,數據分析是一門應用學科,你需要系統提升數據獲取、數據分析、數據可視化、機器學習的水平。

第一階段:Excel數據分析

每一位數據分析師都脫離不開Excel。

它是日常工作中最常用的工具,如果不考慮性能和數據量,它可以應付絕大部分分析工作。雖然現在機器學習滿地走,Excel依舊是無可爭議的第一工具。

對於沒有經驗的你,Excel是一款必須熟練的工具。它是日常工作中最常用的工具,如果不考慮性能和數據量,它可以應付絕大部分分析工作。

第二階段:SQL資料庫語言

作為數據分析人員,我們首先要知道如何去獲取數據,其中最常見的就是從關係型資料庫中取數,因此你可以不會R,不會python,但是你不能不會SQL。

DT時代,數據正在呈指數級增長。Excel對十萬條以內的數據處理起來沒有問題,但是往小處說,但凡產品有一點規模,數據都是百萬起。這時候就需要學習資料庫。

會在招聘條件中,越來越多的產品和運營崗位,將會SQL作為優先的加分項。SQL是數據分析的核心技能之一,從Excel到SQL是數據處理效率的一大進步。

主要了解資料庫查詢語言,where,group by,orderby,having,like,count,sum,min,max,distinct,if,join,left join,limit,and和or的邏輯,時間轉換函數等。

學習SQL最快的方法是能自己下載資料庫管理工具,找些數據練習。客戶端這裡推薦MYSQL。

推薦書籍:《MYSQL必知必會》

第三階段:數據可視化商業智能

數據可視化能力已經越來越成為各崗位的基礎技能。領英的數據報告顯示,數據可視化技能在歷年年中國最熱門技能中排名第一。

可視化工作幾乎是你正式進行數據分析的第一步,通過SQL拿到數據之後,我們需要使用可視化方法探索和發現數據中的模式規律。

數據分析界有一句經典名言,字不如表,表不如圖。實際上除掉數據挖掘這類高級分析,不少數據分析就是監控數據和觀察數據。

除此此外,數據分析的大多時候都是要兜售自己的觀點和結論的,而兜售的最好方式就是做出觀點清晰數據詳實的PPT和報表給老闆看。

可視化的工具有很多,這裡我推薦Tableau或者FineBI。這兩款都不要編程功底,實現起來簡單,功能強大。下圖是Excel製作銷售管理分析儀案例:

Tableau製作股票分析儀:

FineBI可視化分析:

推薦書籍:《用圖表說話》-麥肯錫

第四階段:數理統計學

統計學是數據分析最重要的基礎之一,是數據分析的基石和方法論。

統計知識會要求我們以另一個角度看待數據。當你知道AB兩組的差異用平均值看是多傻的事情,你的分析技巧也會顯著提高。

這裡我們需要從基礎的統計理論(描述性統計、區間估計、假設檢驗等)出發,到基本的統計分析(T 檢驗、方差分析等),最後到商業常用的模型(回歸分析、方差分析等),學習數據分析背後的邏輯,掌握實用統計學的概念和會利用統計的思維去思考問題。

推薦書籍:《從零進階 數據分析的統計基礎》-曹正鳳;《統計學》-賈俊平

第五階段:數據分析與軟體應用

SPSS是統計分析入門軟體,如果你想快速入門而又不想學習編程,我推薦使用SPSS。

SPSS軟體是世界三大統計分析軟體之一,以其易於操作、易於入門,結果易於閱讀的優點,一直備受數據分析人員的青睞,一般經過短期學習即可用SPSS 做簡單的數據分析,包括繪製圖表、簡單回歸、相關分析等等。

學習SPSS的重點並不在於軟體本身,而是相關的統計學知識,這也是在前面建議大家鋪墊的,也就是你要學會怎樣去分析「輸入數據後,軟體給你呈現的結果」。

推薦書籍

《如虎添翼 數據處理的SPSS/SAS EG實現》-徐筱剛

《胸有成竹 數據分析的SPSS/SAS EG進階》-常國珍

《SPSS統計分析基礎教程+高級教程》-張文彤

第六階段:數據挖掘與軟體應用

數據挖掘,英文是Data Mining 也叫作數據勘探,類似於採礦,但是數據是貧礦。我們需要結合行業課題,利用數據挖掘工具,建置數據挖掘模型,發掘規律和商業價值。另外數據挖掘是交叉學科,涉及統計學、計算機、機器學習、運籌學等多門學科,是一個運用廣泛和富有前景的學科領域。

學習演算法模型包括線性回歸、邏輯回歸、主成分分析、因子分析、聚類、關聯規則、決策樹、隨機森林、支持向量機、貝葉斯、神經網路等。

對於工具,這一階段,建議選擇一門編程語言來學習。

Python或者R語言,這一點是必備項也是加分項,在數據挖掘方向是必備項,語言相比較工具更加靈活也更加實用。

對於R和Python,我們應該使用哪種語言,已經爭論很多年了,至今沒有定論...... 事實大概是Python的主要功能是編程,除了單純的數據分析,在很多領域還有廣泛利用,所以就業市場上對Python的需求是遠大於R。

R主要側重統計功能,在統計方面顯示出了很多的優勢,用R做單純的數據分析還是妥妥的穩穩的。但是往數據科學方向走的話,R就有點頂不住了,輪到Python揚眉吐氣了......

是否具備編程能力,是初級數據分析和高級數據分析的風水嶺。數據挖掘、BI、爬蟲、可視化報表都需要用到編程。以下以python介紹語言學習的路徑:

Python則是萬能的膠水語言,適用性強,可以將分析的過程腳本化。Pandas、Numpy、SKLearn等包也是非常豐富。Python學習導圖:

推薦書籍:

《笨方法學Python》《像計算機科學家一樣思考》

《Python數據科學手冊》《利用Python進行數據分析》《數據科學入門》

《機器學習實戰:基於Scikit-Learn和TensorFlow》

《數據挖掘實戰》

《Python深度學習》

第七階段:數據分析行業應用和數據分析思維

對於數據分析師來說,業務的瞭解比數據方法論更重要。當然很遺憾,業務學習沒有捷徑。

推薦書籍:《增長黑客》;《精益數據分析》

以上就是商業數據分析師的完整進階路線,如果你沿著此路線學習,相信你在數據分析道路上有所收穫。


作為一家擁有超多數據分析師的公司,怒答一波!

為你推薦初階數據分析師的10個必備網站+5本必看書籍+3個必備工具

10 個必備網站

  1. 中國經濟網數據中心

2. 互聯網數據中心

3. IDC中國

4. CNZZ數據中心

5. 百度數據中心

6. 智庫數據

7. 淘寶數據平臺

8. 艾瑞諮詢

9. 互聯網信息中心

10. 國家數據

5 本必看書籍

1.《深入淺出數據分析》:HeadFirst 類的書籍,一向淺顯易懂形象生動,可以對分析概念有個全面的認知。

2.《誰說菜鳥不會數據分析》:不僅講解了一些常見的分析技巧,並附帶 Excel 的一些知識以及數據分析在公司中所處的位置,對職場瞭解亦有一定幫助。

3.《赤裸裸的統計學》:作者年輕時是個追求學習意義的學霸,後來自己從統計學中發掘了很多可以應用到生活的地方。這也是本書的主旨,結合生活講解統計知識,生動有趣。可以避免統計學一上來就大講貝葉斯概率和隨機分析的枯燥。

4.《統計數字會撒謊》:這本書知名度要高點,建議初學者可以好好看看。

5. 《SQL 從入門到精通》:學習 SQL 的入門書,薄冊子一本,看起來很快。SQL 是個性價比很高的技能,簡單而強大。任何想進一步提高自己數據分析技能的產品/運營/分析師 同學,都建議點亮這個技能點。

3 個必備工具

  1. PowerBI:BI(商業智能)工具,涵蓋了報表、數據分析、可視化等多層。此外,底層還可於數據倉庫銜接,構建OLAP分析模型。
  2. GrowingIO:支持網站、App、小程序數據採集和分析,對於數據分析師來說無需埋點,只需三行代碼,一次部署,就可以秒級出各種趨勢、漏斗等圖。可以為數據分析師節省大量時間,把重點真正落實到數據分析!分析!分析!上(重要的事說三遍 )
  3. Rattle GUI:如果想用 R 語言完成數據分析,可以試試 Rattle。這個 GUI 基於 R 語言,在 R 中輸入 install.packages("rattle"),然後 library(rattle),接著再輸入 rattle(),就能啟動 Rattle 了。

發佈於 2020-03-11繼續瀏覽內容知乎發現更大的世界打開Chrome繼續猴子猴子?

中國科學院大學 電子與通信工程碩士本回答節選自鹽選專欄,有助於解答該問題

我們先從整體上了解數據分析師要掌握的技能有哪些,然後再從具體職位類別來看,不同的職位具體要掌握的技能有哪些。


這樣你不僅可以從整體上有了全局的認識,還能從細節上知道不同職位類別的技能是什麼,這樣你就能根據自己的實際情況,有針對性的準備和學習。

一、數據分析的勝任力模型是什麼?


從整體上來看,數據分析師需要掌握的能力有很多,從總體上可以分為以下幾類,這些能力構成了數據分析師的能力模型。



1)理論基礎,包括統計學


2)數據分析工具,常用的分析工具有 Excel,SQL,Python 等


3)可視化工具,常用的有 Excel,商業智能(Business Intelligence,BI)


4)業務知識,包括常用的指標、某行業的業務流程


5)數據分析思維,包括常用的分析方法

6)通用能力,包括 PPT、溝通能力


下面我們來詳細看下每一種能力的要求。


1.理論基礎:統計學


數據分析背後的理論基礎是統計學。所以,掌握了統計學以後我們才能去看懂數據表達的意義是什麼。舉個例子,給你一家公司員工的工資,是平均值能代表這家公司的工資水平,還是中位數能代表?


如果沒學過統計學,那麼可能只認識這裡的平均值,而不知道中位數這個知識。但是,如果你學過了統計學就會知道,中位數比平均值更能反映出數據的集中表現。


統計學的內容比較多,詳細又可以分為兩類內容:描述統計分析、推論統計分析。


什麼是描述統計分析?


對大量信息進行歸納是處理數據時最基本的任務。中國約有 14 億人,一張記錄每位中國人的姓名和收入的電子表格包含了我們衡量這個國家經濟健康狀況所需的所有信息,通常我們也將多個數據集合在一起的東東叫「簡稱數據集」。但這張信息過量的表格其實相當於什麼都沒有告訴我們。這就是讓人覺得諷刺的地方:經常是數據越多,事實越模糊。??


因此,我們需要簡化,將一系列複雜的數據減少為幾個能夠起到描述作用的數字,正如奧運會體操比賽中,我們將一套多難度組合的複雜動作濃縮為一個得分:9.8 分。?


描述統計分析就是將一系列複雜的數據減少為幾個能夠起到描述作用的數字,用這些有代表性的數字來代表所有的數據。這樣在面對一大堆數據時,你可在不知道所有數據的情況下就能知道數據的整體情況。??


這就好比,我們通常一說起美女,能想到的是這樣幾個指標:長腿,大眼睛,臉蛋好看。雖然全國有那麼多美女,你也沒有見過全部的美女,但是你卻能通過這樣幾個代表美女的指標就可以大概知道什麼是美女。?



?同樣的,描述統計學的關鍵點在於,找到幾個關鍵的數字來描述數據的整體情況。那麼,問題就來了,能擔當起這樣重要責任的數字有哪些呢?描述數據的整體情況,我們可以用 4 個指標來做,分別是:平均值、四分位數、標準差和標準分。?例如,前面我們在拿到工資數據,就可以用「中位數」這樣的數字來描述工資的整體情況。


所以,描述統計分析就是掌握 4 個指標:平均值,四分位數,標準差和標準分。


什麼是推論統計分析?


推論統計分析就是通過樣本來推斷出總體。需要掌握的知識包括概率分佈、中心極限定、如何用樣本估計總體、置信區間、假設檢驗。例如,互聯網常用的 AB 測試背後的原理就是假設檢驗,如果不掌握推論統計分析,那麼連 AB 測試的結果也看不懂,更不用說完成一個 AB 測試實驗。


2.數據分析工具


很多人看到現在 Python 很火,就不管自己的能力水平如何,就一頭扎進學習 Python 的大潮,最後發現其實自己學不會,或者學完用不上。


這其實是不對的,真正工作裏最常用的數據分析工具其實是 Excel,SQL。所以,如果你的零基礎,不建議一上來就學 Python,而是先學會 Excel 分析數據,然後學會 SQL。


這樣你學會了常用的分析工具,然後再學 Python 纔是加分項。同時,這樣學習的順序還有一個好處,如果你是零基礎沒學過編程,一上來學 Python,大概率是學不會的。但是如果你學過用 Excel、SQL 處理數據,那麼就具備了一定的基礎,再學 Python,很多概念就會理解起來比較容易。


這就好比,一個嬰兒不是一上來就學習跑步(Python),而是先把走路學會,具備了走路(Excel、SQL)的基礎,再跑步就容易多了。



需要注意的是,除非是工作必須要求的,其他少部分公司用的工具其實不需要學習。比如有些公司要求其他編程語言,例如 R、SPSS、SAS 這些工具。


現在 Pyhon 已經是人工智慧排名第一的編程語言了,大部分公司要求 Python,很少部分的公司要求其他的編程語言,所以學習市場要求最多的那個技能才能找到更多機會。如果你學習了少部分公司纔要求的工具,那麼意味著你找工作或者跳槽只能選擇這些公司,而會錯失其他大部分公司的求職機會,對你整個職業生涯不利。


TIOBE 編程語言排行榜是全球編程語言流行趨勢的一個指標,每月更新,官網地址(https://www.tiobe.com/tiobe-index)。?下圖是 2021 年 2 月份排名前 10 的編程語言的變化圖,其中橙色曲線是 Python,我們會發現 Python 的流行趨勢越來越高。
TIOBE 編程語言排行榜是全球編程語言流行趨勢的一個指標,每月更新,官網地址(https://www.tiobe.com/tiobe-index)。?下圖是 2021 年 2 月份排名前 10 的編程語言的變化圖,其中橙色曲線是 Python,我們會發現 Python 的流行趨勢越來越高。

3.可視化工具


常用的可視化工具包括 Excel、商業智能(BI)。


一般的可視化圖表用 Excel 裏的圖表功能就可以實現,而且使用起來也方便。如果是要經常做報表,並且要求實現報表自動化,那麼就需要用到商業智能(BI)工具。


那什麼是商業智能(BI)呢?


微軟官方給的定義是「使用用於自助服務和企業商業智能 (BI) 的統一、可擴展平臺(該平臺易於使用,可幫助獲取更深入的數據見解),連接到任何數據並對數據進行可視化。 」


毫無懸念,看這種官方定義就是看不懂。簡單來說就是把數據導入商業智能(BI)工具中,就可以快速對數據可視化。例如下圖就是把數據導入用商業智能(BI)工具中,通過可視化數據來分析。



IDC《2019 年下半年中國商業智能軟體市場數據跟蹤報告》顯示,在中國商業智能軟體子市場中,報表分析仍是目前市場最主要的需求,2019 年全年年市場份額佔比為 79.0%。高級分析和預測分析市場份額佔比 21.0%(下圖)。



常用的商業智能(BI)工具有哪些呢?


目前使用最多的商業智能(BI)工具是 Power BI、Tableau、帆軟,選擇其中任意一種學習就可以了。


4.業務知識


因為數據分析是用來解決具體行業問題的,需要從業務的角度出發,瞭解各個指標,以及每個指標之間的關係,還需要聯繫業務去理解數據。所以,工作中數據分析脫離不了業務,在分析中要找到導致問題發生的根本原因,而不只是單純的統計數據。


因此需要具備某個行業的業務知識才能去理解這個行業裏的術語、業務問題等。


業務知識包括某個行業的常用指標、業務流程。需要注意的是,不同行業的指標、業務流程是不一樣的,所以需要學習的時候針對你的目標行業去學習準備。例如,下圖分別是金融信貸行業、在線教育行業的業務流程。


金融信貸行業業務流程(來自書《數據分析思維》)
金融信貸行業業務流程(來自書《數據分析思維》)

在線教育業務流程(來自書《數據分析思維》)
在線教育業務流程(來自書《數據分析思維》)

如果是剛入門,這塊內容做到了解即可,等進入工作以後,再慢慢深入業務,積累業務經驗。具體某個行業的常用指標、業務流程可以看書《數據分析思維》,這本書裏涉及了 10 多個行業的指標、業務流程。


5.數據分析思維


在數據分析相關的職位裏經常會寫這麼一條招聘要求「具備數據分析思維」。在工作或者面試中,會經常聽到分析思維、分析思路、分析方法。這三個詞語有什麼關係呢?其實簡單來說,它們都是指分析方法。


數據分析思維需要你掌握 10 種常用的分析方法。


數據分析 10 種常用的分析方法
數據分析 10 種常用的分析方法

如果你的分析目的是想將複雜問題變得簡單,就可以使用邏輯樹分析方法,例如經典的費米問題就可以用這個分析方法。


如果你的分析目的是做行業分析,那麼就可以用 PEST 分析方法,例如你想要研究中國少兒編程行業。


如果你想從多個角度去思考問題,那麼就可以用多維度拆解分析方法,例如找相親對象,需要從多個角度去分析是否合適。


如果你想進行對比分析,就要用到對比分析方法,例如你朋友問自己胖嗎,就是在對比。


如果你想找到問題發生的原因,那麼就要用到假設檢驗分析方法,其實破案劇裏警察就是用這個方法來破案的。


如果你想知道 A 和 B 有什麼關係,就要用到相關分析方法,例如豆瓣在我們喜歡的電影下面推薦和這部分電影相關的電影。


如果你想對用戶留存和流失分析,就要用到羣組分析方法,例如微博用戶留存分析。


如果你想對用戶按價值分類,那麼就要用到 RFM 分析方法,例如信用卡的會員服務,就是對用戶按價值分類,對不同用戶使用不同的營銷策略,從而做到精細化運營。


如果你想分析用戶的行為或者做產品運營,就要用到 AARRR 模型分析方法,例如對拼多多的用戶進行分析。


如果你想分析用戶的轉化,就要用到漏斗分析方法,例如店鋪本週銷量下降,想知道是中間哪個業務環節出了問題。


6.通用能力


通用能力包括 PPT 製作分析報告、溝通能力。


在工作中,要經常做分析結果做成數據分析報告,然後展示給業務部門、上級領導、客戶等,而這種展示數據分析報告的場景常用的工具就是 PPT,所以就要求你會用 PPT 製作數據分析報告,有較好的的文字、書面總結能力。


職業社交網站領英發布的《2018 新興工作崗位報告》報告裏說,最大的技能缺口是軟技能,比如口頭交流、領導力和時間管理等。這份報告中建議,職場人士需要在快速變化的工作環境中,學習並保持軟技能,因為擁有這些技能的人才具備更大的職場優勢。


其實,任何職位都需要溝通能力,但是,數據分析師對溝通能力的要求更高。因為,數據分析師解決的是實際的問題,需要跨部門溝通業務,做好的數據分析報告也要展示給各個部門、領導、客戶,只有好的溝通能力,才能讓你的分析結果得到用戶的認可。 那麼這些通用能力如何提升呢?最直接的方式,就是通過寫文章來提升。


通過寫作可以同時提升你下面 3 個能力:


1)邏輯能力


寫作的本質其實是把一件事情講清楚,而邏輯能力強的人寫出來的內容,讀起來更順暢。


2)文字表達能力


數據分析師要經常做數據分析報告,和通過郵件彙報分析結果。這體現的其實就是文字表達能力,提高這個能力的辦法就是不斷去寫作。


3)溝通能力


寫作其實就是把想說的話通過文字和你的用戶去溝通。另外,經常在社羣裏提問和解答他人的問題,也可以提高你的溝通能力。你會看到不同人提問的水平是不一樣的,有的人可以完整的把一個問題描述清楚,有的人說完,其他人也不明白他的問題是什麼。這其實就是體現了溝通能力。


二、不同職位的數據分析能力要求有什麼不一樣?


經過前面的分析,我們從整體上知道了數據分析師需要掌握的能力。但並不是說,這些能力全都掌握了你才能找到一份數據分析師的工作。因為不同的職位的要求不一樣的。在《職業發展前景:數據分析師的晉陞通道》章節我們知道了數據分析相關職位的分類。



我把勝任力模型中的這些能力對應到不同的職位,就可以清楚的看到對應職位的能力要求(下圖)。



有一個誤區,很多人以為只要掌握了分析工具,就掌握了數據分析,其實不是的。從圖中,我們可以看出。各個數據分析職位都需要的能力是:業務知識、分析思維、PPT、溝通能力。這些能力纔可以讓你從一個只會舞弄工具的普通職場人變成真正解決業務問題的職場高手。


很多人以為數據分析師需要掌握很高大的工具,其實不是的。例如騰訊裏有一個崗位叫「商業數據分析師」,這聽起來很高大上。其實這個職位對應的就是上圖初級數據分析師的能力要求,也就是理論基礎(描述統計分析),分析工具(Excel),可視化工具(Excel)。


上圖中黃色標出的是相對於前一職位多出來的能力。中級數據分析師在初級數據分析師要求的能力上增加了分析工具(SQL),可視化工具(商業智能 BI)。高級數據分析師在中級數據分析師要求的能力上增加了理論基礎(推論統計分析),分析工具(Python)。

Excel、SQL、Python 要掌握到什麼程度?

我們知道了數據分析師最常用的分析工具是 Excel、SQL、Python。那麼問題就來了,這些分析工具具體掌握哪些內容呢?


一、Excel 需要掌握下面的知識點:



1)數據清洗相關的功能


查找和刪除重複數據,對應的是 Excel 裏的刪除重複項功能。


數據抽取,也就是從一堆雜亂的數據中找出想要的數據,例如薪資「10k-20k」,需要從中截取出最低薪水「10」和最高薪水「20」,這就要用到 Excel 的字元串截取函數 left、right、mid)。


數據計算函數,包括平均值(average)、求和(sum)、最大值(max)、最小值(min)等),日期函數(date),判斷函數(if,or,countif)。


2)數據分析相關的功能

最低 0.3 元/天開通會員,查看完整內容

購買該鹽選專欄查看完整 10 篇內容

鹽選專欄

數據分析入行指南:助你互聯網行業發展有「錢」途

猴子 猴子數據分析學院創始人,著有暢銷書《數據分析思維》

¥9.90 會員免費

發佈於 03-10繼續瀏覽內容知乎發現更大的世界打開Chrome繼續愛數據-橙子愛數據-橙子0基礎入職數據分析師

首先你要先做的是背景評估,是否適合學習並且做數據分析,因為不是所有人都適合轉行或學習數據分析,比如專業極度不相關,年齡較大或者城市基因不匹配的都不適合學,因為我們最終是以入職為目標的。

假設你全都滿足的情況我們都需要學習什麼呢?

我們可以先分析一個JD

以上我們很清晰的分析出數據分析師要具備以下5種能力:他們分別是數據工具、業務理解、溝通表達、思維邏輯和報告撰寫

從初級數據分析師招聘要求的必須技能來看,主要包括理論知識工具實踐兩部分內容。

理論部分統計學:為什麼將統計學放在第一位呢?因為統計學是數據分析的基石,而且統計分析可以解決日常大部分的分析需求。統計學這部分內容需要學習描述統計、假設檢驗、貝葉斯、概率、分佈、抽樣、線性回歸、時間序列等內容。數據分析方法論:這裡要學習一些數據分析常用到分析方法,如趨勢分析法、對比分析法、多維分解法、用戶細查、漏斗分析、留存分析、AB測試法、4P理論、PESTEL理論、SWOT分析、5W2H理論、邏輯樹理論、用戶使用行為理論、AARRR模型等。

工具部分

Excel:它是最基礎的數據分析工具。在學習的Excel的時候需要重點掌握:常用函數的使用、快捷鍵操作、基礎圖表製作、數據透視表、Vlookup等。另外Excel還可以導入一些模板來使用,典型的包括數據分析模塊、做假設檢驗經常用到;規劃求解,做線性規劃和決策等問題非常有效。SQL:它是數據分析的核心技能,SQL要重點學習Select,聚合函數、以及條件查詢(Where、Group by、Order by等)PPT:用來和業務部門交流需求,展示分析結果。Python:主要學習Numpy、Pandas、Matplotlib、Seaborn等內容。Python 的底層是用 C 語言寫的,很多標準庫和第三方庫也都是用 C 寫的,在處理數據時候運行速度非常快。這裡需要注意的是不同公司對工具的要求也不同,例如有些公司要求會使用R語言、SPSS等,具體學哪一個工具可以參照JD要求,其中Excel、SQL和PPT是必備的基礎技能工具

學習可以分為兩個途徑:

1.自學:需要有極強的自律性,以及對學習資料和內容篩選的能力。否則效率會非常的低,而且一定要制定學習計劃,根據學習計劃執行。包括你要投遞簡歷的時間,入職的時間等等。都要給自己一個規劃。否則會容易懈怠。資料可以去通過一些行業領域的公眾號,數據領域相關網站以及知乎,B站等去獲取。

2.報班:效率會相對比較高,而且會非常快速的收穫並且融入數據圈獲得更多資源。讓自己有一個更好的發展路徑規劃。但是選擇機構就要非常的謹慎,避免掉坑。可以從師資力量(講師是否在職,切記紙上談兵的講師),課程實用性(要有實戰以及真實資料庫),職場支持(根據城市基因個人背景做支持,忌所謂的包就業)等內容綜合做評估

最後,一定給自己做一個職業規劃,瞭解不同層級的數據分析師要掌握什麼技能,想清楚自己未來的目標崗位,不斷的去學習和提升自己,再一步步朝著目標邁進。

希望以上回答對題主以及剛剛想步入數據領域的小夥伴有幫助,歡迎同樣困惑的小夥伴可以私信我。或者留言評論進橙子數據學習社羣


我們先從整體上了解數據分析師要掌握的技能有哪些,然後再從具體職位類別來看,不同的職位具體要掌握的技能有哪些。


這樣你不僅可以從整體上有了全局的認識,還能從細節上知道不同職位類別的技能是什麼,這樣你就能根據自己的實際情況,有針對性的準備和學習。

一、數據分析的勝任力模型是什麼?


從整體上來看,數據分析師需要掌握的能力有很多,從總體上可以分為以下幾類,這些能力構成了數據分析師的能力模型。



1)理論基礎,包括統計學


2)數據分析工具,常用的分析工具有 Excel,SQL,Python 等


3)可視化工具,常用的有 Excel,商業智能(Business Intelligence,BI)


4)業務知識,包括常用的指標、某行業的業務流程


5)數據分析思維,包括常用的分析方法


6)通用能力,包括 PPT、溝通能力


下面我們來詳細看下每一種能力的要求。


1.理論基礎:統計學


數據分析背後的理論基礎是統計學。所以,掌握了統計學以後我們才能去看懂數據表達的意義是什麼。舉個例子,給你一家公司員工的工資,是平均值能代表這家公司的工資水平,還是中位數能代表?


如果沒學過統計學,那麼可能只認識這裡的平均值,而不知道中位數這個知識。但是,如果你學過了統計學就會知道,中位數比平均值更能反映出數據的集中表現。


統計學的內容比較多,詳細又可以分為兩類內容:描述統計分析、推論統計分析。


什麼是描述統計分析?


對大量信息進行歸納是處理數據時最基本的任務。中國約有 14 億人,一張記錄每位中國人的姓名和收入的電子表格包含了我們衡量這個國家經濟健康狀況所需的所有信息,通常我們也將多個數據集合在一起的東東叫「簡稱數據集」。但這張信息過量的表格其實相當於什麼都沒有告訴我們。這就是讓人覺得諷刺的地方:經常是數據越多,事實越模糊。??


因此,我們需要簡化,將一系列複雜的數據減少為幾個能夠起到描述作用的數字,正如奧運會體操比賽中,我們將一套多難度組合的複雜動作濃縮為一個得分:9.8 分。?


描述統計分析就是將一系列複雜的數據減少為幾個能夠起到描述作用的數字,用這些有代表性的數字來代表所有的數據。這樣在面對一大堆數據時,你可在不知道所有數據的情況下就能知道數據的整體情況。??


這就好比,我們通常一說起美女,能想到的是這樣幾個指標:長腿,大眼睛,臉蛋好看。雖然全國有那麼多美女,你也沒有見過全部的美女,但是你卻能通過這樣幾個代表美女的指標就可以大概知道什麼是美女。?



?同樣的,描述統計學的關鍵點在於,找到幾個關鍵的數字來描述數據的整體情況。那麼,問題就來了,能擔當起這樣重要責任的數字有哪些呢?描述數據的整體情況,我們可以用 4 個指標來做,分別是:平均值、四分位數、標準差和標準分。?例如,前面我們在拿到工資數據,就可以用「中位數」這樣的數字來描述工資的整體情況。


所以,描述統計分析就是掌握 4 個指標:平均值,四分位數,標準差和標準分。


什麼是推論統計分析?


推論統計分析就是通過樣本來推斷出總體。需要掌握的知識包括概率分佈、中心極限定、如何用樣本估計總體、置信區間、假設檢驗。例如,互聯網常用的 AB 測試背後的原理就是假設檢驗,如果不掌握推論統計分析,那麼連 AB 測試的結果也看不懂,更不用說完成一個 AB 測試實驗。


2.數據分析工具


很多人看到現在 Python 很火,就不管自己的能力水平如何,就一頭扎進學習 Python 的大潮,最後發現其實自己學不會,或者學完用不上。


這其實是不對的,真正工作裏最常用的數據分析工具其實是 Excel,SQL。所以,如果你的零基礎,不建議一上來就學 Python,而是先學會 Excel 分析數據,然後學會 SQL。


這樣你學會了常用的分析工具,然後再學 Python 纔是加分項。同時,這樣學習的順序還有一個好處,如果你是零基礎沒學過編程,一上來學 Python,大概率是學不會的。但是如果你學過用 Excel、SQL 處理數據,那麼就具備了一定的基礎,再學 Python,很多概念就會理解起來比較容易。


這就好比,一個嬰兒不是一上來就學習跑步(Python),而是先把走路學會,具備了走路(Excel、SQL)的基礎,再跑步就容易多了。



需要注意的是,除非是工作必須要求的,其他少部分公司用的工具其實不需要學習。比如有些公司要求其他編程語言,例如 R、SPSS、SAS 這些工具。


現在 Pyhon 已經是人工智慧排名第一的編程語言了,大部分公司要求 Python,很少部分的公司要求其他的編程語言,所以學習市場要求最多的那個技能才能找到更多機會。如果你學習了少部分公司纔要求的工具,那麼意味著你找工作或者跳槽只能選擇這些公司,而會錯失其他大部分公司的求職機會,對你整個職業生涯不利。


TIOBE 編程語言排行榜是全球編程語言流行趨勢的一個指標,每月更新,官網地址(https://www.tiobe.com/tiobe-index)。?下圖是 2021 年 2 月份排名前 10 的編程語言的變化圖,其中橙色曲線是 Python,我們會發現 Python 的流行趨勢越來越高。
TIOBE 編程語言排行榜是全球編程語言流行趨勢的一個指標,每月更新,官網地址(https://www.tiobe.com/tiobe-index)。?下圖是 2021 年 2 月份排名前 10 的編程語言的變化圖,其中橙色曲線是 Python,我們會發現 Python 的流行趨勢越來越高。

3.可視化工具


常用的可視化工具包括 Excel、商業智能(BI)。


一般的可視化圖表用 Excel 裏的圖表功能就可以實現,而且使用起來也方便。如果是要經常做報表,並且要求實現報表自動化,那麼就需要用到商業智能(BI)工具。


那什麼是商業智能(BI)呢?


微軟官方給的定義是「使用用於自助服務和企業商業智能 (BI) 的統一、可擴展平臺(該平臺易於使用,可幫助獲取更深入的數據見解),連接到任何數據並對數據進行可視化。 」


毫無懸念,看這種官方定義就是看不懂。簡單來說就是把數據導入商業智能(BI)工具中,就可以快速對數據可視化。例如下圖就是把數據導入用商業智能(BI)工具中,通過可視化數據來分析。



IDC《2019 年下半年中國商業智能軟體市場數據跟蹤報告》顯示,在中國商業智能軟體子市場中,報表分析仍是目前市場最主要的需求,2019 年全年年市場份額佔比為 79.0%。高級分析和預測分析市場份額佔比 21.0%(下圖)。



常用的商業智能(BI)工具有哪些呢?


目前使用最多的商業智能(BI)工具是 Power BI、Tableau、帆軟,選擇其中任意一種學習就可以了。


4.業務知識


因為數據分析是用來解決具體行業問題的,需要從業務的角度出發,瞭解各個指標,以及每個指標之間的關係,還需要聯繫業務去理解數據。所以,工作中數據分析脫離不了業務,在分析中要找到導致問題發生的根本原因,而不只是單純的統計數據。


因此需要具備某個行業的業務知識才能去理解這個行業裏的術語、業務問題等。


業務知識包括某個行業的常用指標、業務流程。需要注意的是,不同行業的指標、業務流程是不一樣的,所以需要學習的時候針對你的目標行業去學習準備。例如,下圖分別是金融信貸行業、在線教育行業的業務流程。


金融信貸行業業務流程(來自書《數據分析思維》)
金融信貸行業業務流程(來自書《數據分析思維》)

在線教育業務流程(來自書《數據分析思維》)
在線教育業務流程(來自書《數據分析思維》)

如果是剛入門,這塊內容做到了解即可,等進入工作以後,再慢慢深入業務,積累業務經驗。具體某個行業的常用指標、業務流程可以看書《數據分析思維》,這本書裏涉及了 10 多個行業的指標、業務流程。


5.數據分析思維


在數據分析相關的職位裏經常會寫這麼一條招聘要求「具備數據分析思維」。在工作或者面試中,會經常聽到分析思維、分析思路、分析方法。這三個詞語有什麼關係呢?其實簡單來說,它們都是指分析方法。


數據分析思維需要你掌握 10 種常用的分析方法。


數據分析 10 種常用的分析方法
數據分析 10 種常用的分析方法

如果你的分析目的是想將複雜問題變得簡單,就可以使用邏輯樹分析方法,例如經典的費米問題就可以用這個分析方法。


如果你的分析目的是做行業分析,那麼就可以用 PEST 分析方法,例如你想要研究中國少兒編程行業。


如果你想從多個角度去思考問題,那麼就可以用多維度拆解分析方法,例如找相親對象,需要從多個角度去分析是否合適。


如果你想進行對比分析,就要用到對比分析方法,例如你朋友問自己胖嗎,就是在對比。


如果你想找到問題發生的原因,那麼就要用到假設檢驗分析方法,其實破案劇裏警察就是用這個方法來破案的。


如果你想知道 A 和 B 有什麼關係,就要用到相關分析方法,例如豆瓣在我們喜歡的電影下面推薦和這部分電影相關的電影。


如果你想對用戶留存和流失分析,就要用到羣組分析方法,例如微博用戶留存分析。


如果你想對用戶按價值分類,那麼就要用到 RFM 分析方法,例如信用卡的會員服務,就是對用戶按價值分類,對不同用戶使用不同的營銷策略,從而做到精細化運營。


如果你想分析用戶的行為或者做產品運營,就要用到 AARRR 模型分析方法,例如對拼多多的用戶進行分析。


如果你想分析用戶的轉化,就要用到漏斗分析方法,例如店鋪本週銷量下降,想知道是中間哪個業務環節出了問題。


6.通用能力


通用能力包括 PPT 製作分析報告、溝通能力。


在工作中,要經常做分析結果做成數據分析報告,然後展示給業務部門、上級領導、客戶等,而這種展示數據分析報告的場景常用的工具就是 PPT,所以就要求你會用 PPT 製作數據分析報告,有較好的的文字、書面總結能力。


職業社交網站領英發布的《2018 新興工作崗位報告》報告裏說,最大的技能缺口是軟技能,比如口頭交流、領導力和時間管理等。這份報告中建議,職場人士需要在快速變化的工作環境中,學習並保持軟技能,因為擁有這些技能的人才具備更大的職場優勢。


其實,任何職位都需要溝通能力,但是,數據分析師對溝通能力的要求更高。因為,數據分析師解決的是實際的問題,需要跨部門溝通業務,做好的數據分析報告也要展示給各個部門、領導、客戶,只有好的溝通能力,才能讓你的分析結果得到用戶的認可。 那麼這些通用能力如何提升呢?最直接的方式,就是通過寫文章來提升。


通過寫作可以同時提升你下面 3 個能力:


1)邏輯能力


寫作的本質其實是把一件事情講清楚,而邏輯能力強的人寫出來的內容,讀起來更順暢。


2)文字表達能力


數據分析師要經常做數據分析報告,和通過郵件彙報分析結果。這體現的其實就是文字表達能力,提高這個能力的辦法就是不斷去寫作。


3)溝通能力


寫作其實就是把想說的話通過文字和你的用戶去溝通。另外,經常在社羣裏提問和解答他人的問題,也可以提高你的溝通能力。你會看到不同人提問的水平是不一樣的,有的人可以完整的把一個問題描述清楚,有的人說完,其他人也不明白他的問題是什麼。這其實就是體現了溝通能力。


二、不同職位的數據分析能力要求有什麼不一樣?


經過前面的分析,我們從整體上知道了數據分析師需要掌握的能力。但並不是說,這些能力全都掌握了你才能找到一份數據分析師的工作。因為不同的職位的要求不一樣的。在《職業發展前景:數據分析師的晉陞通道》章節我們知道了數據分析相關職位的分類。



我把勝任力模型中的這些能力對應到不同的職位,就可以清楚的看到對應職位的能力要求(下圖)。



有一個誤區,很多人以為只要掌握了分析工具,就掌握了數據分析,其實不是的。從圖中,我們可以看出。各個數據分析職位都需要的能力是:業務知識、分析思維、PPT、溝通能力。這些能力纔可以讓你從一個只會舞弄工具的普通職場人變成真正解決業務問題的職場高手。


很多人以為數據分析師需要掌握很高大的工具,其實不是的。例如騰訊裏有一個崗位叫「商業數據分析師」,這聽起來很高大上。其實這個職位對應的就是上圖初級數據分析師的能力要求,也就是理論基礎(描述統計分析),分析工具(Excel),可視化工具(Excel)。


上圖中黃色標出的是相對於前一職位多出來的能力。中級數據分析師在初級數據分析師要求的能力上增加了分析工具(SQL),可視化工具(商業智能 BI)。高級數據分析師在中級數據分析師要求的能力上增加了理論基礎(推論統計分析),分析工具(Python)。

Excel、SQL、Python 要掌握到什麼程度?

我們知道了數據分析師最常用的分析工具是 Excel、SQL、Python。那麼問題就來了,這些分析工具具體掌握哪些內容呢?


一、Excel 需要掌握下面的知識點:



1)數據清洗相關的功能


查找和刪除重複數據,對應的是 Excel 裏的刪除重複項功能。


數據抽取,也就是從一堆雜亂的數據中找出想要的數據,例如薪資「10k-20k」,需要從中截取出最低薪水「10」和最高薪水「20」,這就要用到 Excel 的字元串截取函數 left、right、mid)。


數據計算函數,包括平均值(average)、求和(sum)、最大值(max)、最小值(min)等),日期函數(date),判斷函數(if,or,countif)。


2)數據分析相關的功能

最低 0.3 元/天開通會員,查看完整內容

購買該鹽選專欄查看完整 10 篇內容

鹽選專欄

數據分析入行指南:助你互聯網行業發展有「錢」途

猴子 猴子數據分析學院創始人,著有暢銷書《數據分析思維》

¥9.90 會員免費

發佈於 03-10繼續瀏覽內容知乎發現更大的世界打開Chrome繼續愛數據-橙子愛數據-橙子0基礎入職數據分析師

首先你要先做的是背景評估,是否適合學習並且做數據分析,因為不是所有人都適合轉行或學習數據分析,比如專業極度不相關,年齡較大或者城市基因不匹配的都不適合學,因為我們最終是以入職為目標的。

假設你全都滿足的情況我們都需要學習什麼呢?

我們可以先分析一個JD

以上我們很清晰的分析出數據分析師要具備以下5種能力:他們分別是數據工具、業務理解、溝通表達、思維邏輯和報告撰寫

從初級數據分析師招聘要求的必須技能來看,主要包括理論知識工具實踐兩部分內容。

理論部分統計學:為什麼將統計學放在第一位呢?因為統計學是數據分析的基石,而且統計分析可以解決日常大部分的分析需求。統計學這部分內容需要學習描述統計、假設檢驗、貝葉斯、概率、分佈、抽樣、線性回歸、時間序列等內容。數據分析方法論:這裡要學習一些數據分析常用到分析方法,如趨勢分析法、對比分析法、多維分解法、用戶細查、漏斗分析、留存分析、AB測試法、4P理論、PESTEL理論、SWOT分析、5W2H理論、邏輯樹理論、用戶使用行為理論、AARRR模型等。

工具部分

Excel:它是最基礎的數據分析工具。在學習的Excel的時候需要重點掌握:常用函數的使用、快捷鍵操作、基礎圖表製作、數據透視表、Vlookup等。另外Excel還可以導入一些模板來使用,典型的包括數據分析模塊、做假設檢驗經常用到;規劃求解,做線性規劃和決策等問題非常有效。SQL:它是數據分析的核心技能,SQL要重點學習Select,聚合函數、以及條件查詢(Where、Group by、Order by等)PPT:用來和業務部門交流需求,展示分析結果。Python:主要學習Numpy、Pandas、Matplotlib、Seaborn等內容。Python 的底層是用 C 語言寫的,很多標準庫和第三方庫也都是用 C 寫的,在處理數據時候運行速度非常快。這裡需要注意的是不同公司對工具的要求也不同,例如有些公司要求會使用R語言、SPSS等,具體學哪一個工具可以參照JD要求,其中Excel、SQL和PPT是必備的基礎技能工具

學習可以分為兩個途徑:

1.自學:需要有極強的自律性,以及對學習資料和內容篩選的能力。否則效率會非常的低,而且一定要制定學習計劃,根據學習計劃執行。包括你要投遞簡歷的時間,入職的時間等等。都要給自己一個規劃。否則會容易懈怠。資料可以去通過一些行業領域的公眾號,數據領域相關網站以及知乎,B站等去獲取。

2.報班:效率會相對比較高,而且會非常快速的收穫並且融入數據圈獲得更多資源。讓自己有一個更好的發展路徑規劃。但是選擇機構就要非常的謹慎,避免掉坑。可以從師資力量(講師是否在職,切記紙上談兵的講師),課程實用性(要有實戰以及真實資料庫),職場支持(根據城市基因個人背景做支持,忌所謂的包就業)等內容綜合做評估

最後,一定給自己做一個職業規劃,瞭解不同層級的數據分析師要掌握什麼技能,想清楚自己未來的目標崗位,不斷的去學習和提升自己,再一步步朝著目標邁進。

希望以上回答對題主以及剛剛想步入數據領域的小夥伴有幫助,歡迎同樣困惑的小夥伴可以私信我。或者留言評論進橙子數據學習社羣


首先你要先做的是背景評估,是否適合學習並且做數據分析,因為不是所有人都適合轉行或學習數據分析,比如專業極度不相關,年齡較大或者城市基因不匹配的都不適合學,因為我們最終是以入職為目標的。

假設你全都滿足的情況我們都需要學習什麼呢?

我們可以先分析一個JD

以上我們很清晰的分析出數據分析師要具備以下5種能力:他們分別是數據工具、業務理解、溝通表達、思維邏輯和報告撰寫

從初級數據分析師招聘要求的必須技能來看,主要包括理論知識工具實踐兩部分內容。

理論部分統計學:為什麼將統計學放在第一位呢?因為統計學是數據分析的基石,而且統計分析可以解決日常大部分的分析需求。統計學這部分內容需要學習描述統計、假設檢驗、貝葉斯、概率、分佈、抽樣、線性回歸、時間序列等內容。數據分析方法論:這裡要學習一些數據分析常用到分析方法,如趨勢分析法、對比分析法、多維分解法、用戶細查、漏斗分析、留存分析、AB測試法、4P理論、PESTEL理論、SWOT分析、5W2H理論、邏輯樹理論、用戶使用行為理論、AARRR模型等。

工具部分

Excel:它是最基礎的數據分析工具。在學習的Excel的時候需要重點掌握:常用函數的使用、快捷鍵操作、基礎圖表製作、數據透視表、Vlookup等。另外Excel還可以導入一些模板來使用,典型的包括數據分析模塊、做假設檢驗經常用到;規劃求解,做線性規劃和決策等問題非常有效。SQL:它是數據分析的核心技能,SQL要重點學習Select,聚合函數、以及條件查詢(Where、Group by、Order by等)PPT:用來和業務部門交流需求,展示分析結果。Python:主要學習Numpy、Pandas、Matplotlib、Seaborn等內容。Python 的底層是用 C 語言寫的,很多標準庫和第三方庫也都是用 C 寫的,在處理數據時候運行速度非常快。這裡需要注意的是不同公司對工具的要求也不同,例如有些公司要求會使用R語言、SPSS等,具體學哪一個工具可以參照JD要求,其中Excel、SQL和PPT是必備的基礎技能工具

學習可以分為兩個途徑:

1.自學:需要有極強的自律性,以及對學習資料和內容篩選的能力。否則效率會非常的低,而且一定要制定學習計劃,根據學習計劃執行。包括你要投遞簡歷的時間,入職的時間等等。都要給自己一個規劃。否則會容易懈怠。資料可以去通過一些行業領域的公眾號,數據領域相關網站以及知乎,B站等去獲取。

2.報班:效率會相對比較高,而且會非常快速的收穫並且融入數據圈獲得更多資源。讓自己有一個更好的發展路徑規劃。但是選擇機構就要非常的謹慎,避免掉坑。可以從師資力量(講師是否在職,切記紙上談兵的講師),課程實用性(要有實戰以及真實資料庫),職場支持(根據城市基因個人背景做支持,忌所謂的包就業)等內容綜合做評估

最後,一定給自己做一個職業規劃,瞭解不同層級的數據分析師要掌握什麼技能,想清楚自己未來的目標崗位,不斷的去學習和提升自己,再一步步朝著目標邁進。

希望以上回答對題主以及剛剛想步入數據領域的小夥伴有幫助,歡迎同樣困惑的小夥伴可以私信我。或者留言評論進橙子數據學習社羣


分為三步。最後一步最關鍵

第一步

網站資源有很多,我推薦你上3Wschool把SQL和python的基礎語法學習一遍。然後百度搜索SQL練習題面試題。python你可以上Kaggle的數據競賽中尋找入門級的比賽。因為代碼開源,你可以自己複製下來,然後一行行在IDE當中做輸入輸出。這是基礎的搜索能力,你自己必須去做,去把陌生的知識運用到入門。

第二步

通過視頻網站學習,可以跟著老師的視頻講解學習消化知識點的思路和消化好難一點的進階知識內容給你帶來知識的解疑和答惑。推薦你去天善智能這個學習網站。天善智能的網站足夠你學習的了,入門和進階的數據課程都有,我自己也在天善智能有錄製課程。有興趣可以看看。

第三步

第一步和第二步的總計劃執行時間不要超過兩個月。趁熱打鐵去面試,去實習去工作,去了解市場對於技能的真正需求和熟練度。

學習,是為了運用,也只有運用、才會讓你真正學到知識和技能!

加油,等你運用熟練後,給公司帶去生產力的貢獻和需求輸出後,你將獲得勞動回報,兵家所言重賞之下必有勇夫,勞動報酬這是會真正讓你更進一步突破數據科學勞動技能的巨大動力!

第三步最為關鍵,第一步和第二步是基礎訓練。

你一定可以的。有問題需要交流你向我私信亦可。


推薦閱讀:
相關文章