如何進行數據分析?成為數據分析師應該怎麼做?


做數據分析需要以目標為導向,更多的是要關注多個數據維度之間的相關關係,而不是單個數據產生的因果關係!

一. 培養數據分析的系統化思維

數據分析一般會存在兩種方向,一種是自上而下,另一種是自下而上。

自上而下的思路在前文已經提到過,具體的思路為:確立數據分析目標——目標影響維度拆解——各數據維度相關關係建立——發現問題數據及出現原因——問題數據優化,這種思路多用戶產品的數據分析體系或者模型的建立,從而保證數據分析的全面性。

自下而上的數據分析思路多用在針對已有數據報表中的數據問題發現,具體思路為:異常數據發現——該異常數據影響因素——影響因素與問題數據之間的相關關係——找出出現異常數據的原因——找到異常數據的解決辦法。

二 .培養數據的敏感度

數據敏感度培養別無他法,除了掌握正確的數據分析方法外,就是每天看數據,每天分析數據,用數據說話。

三.需要掌握的各項技能

作為數據分析師,在工具使用上需要熟練掌握Excel、SQL、PPT、Python等工具。

· Excel是日常工作中用到的最多的工具,常用的函數及數據透視表都要學。

· SQL是數據分析的核心工具,主要學習Select、聚合函數以及條件查詢等內容。

· Python重點掌握Pandas數據結構、Matplotlib庫、Pyecharts庫及Numpy數組。

對於工具來說,不同行業對工具的要求也會有差異,比如金融行業要求SAS等,一般情況下Excel、SQL、PPT、Python這4種工具能搞定大部分的數據分析工作

那麼除了工具技能外,作為數據分析師還要了解統計學知識及數據分析方法、要有一定的數據思維,能夠獨立完成數據報告的撰寫等

希望我的回答對你有幫助,如果有不清楚的可以私信我哈


題主問了兩個問題,一個個來看,首先是如何進行數據分析?

想要做數據分析總結起來就是一句話:

數據分析,就是針對某個問題,將獲取後的數據用分析手段加以處理,並發現業務價值的過程。

我把五個關鍵詞給加粗了,這一句話,基本上可以包含數據分析所必須的流程點,我們一個個講

1、首先第一個關鍵詞是「問題」

我們可以把這個詞解釋「發現問題」或者是「目標問題」,這個關鍵詞的核心是——目標。

數據分析一定要有目標!哪怕業務人員給你提出的問題或者需求,根本不是那麼明確和清晰,你也要找到自己要分析的目標!這是太多人經常會犯的錯誤了,很多人知道數據分析要有目標,但是在實際過程中就成了擺設、花架子、無用功,最後你會變成了什麼呢?就是取數機器。你會發現,你會陷入一個惡性循環,取數、發現沒用-然後取更多的數-直到滿足業務方的需求。

舉個最簡單的例子,業務方最近新上線了一個功能,想讓你分析一下目前這個功能的使用情況。這時候你該怎麼做?你會覺得「分析業務功能情況」是目標,然後根據這個模糊的目標你只能做一些描述性的統計分析,告訴業務方每天UV的最大值,最小值,中位數,平均數,方差,標準差……看起來很厲害的樣子,但這些數據有啥意義呢。

這樣子的目標就是在做樣子,那麼我們應該怎麼做呢?

一是要明確業務方的需求是什麼,然後分析業務最終的目的,把這個目的進行拆解;比如剛才的例子,業務真正想要了解的是什麼,是這個新功能的目的吧,是為了提升客戶的留存率,還是為了提升客戶的轉化率,還是其他的;然後再把這個目的給拆解,確定我們的指標,然後再進行分析。這纔是真正的目標思維。

2、第二個關鍵詞是「獲取」,叫做「數據獲取」或者「數據採集」

數據採集就是將原始數據從資料庫中取出來,數據分析師在這一步更為重要的工作是搞清楚數據放在哪裡+怎麼把數據取出來這麼兩件事。

數據存放在哪裡?

很簡單的答案,很多人都知道公司的業務數據一般都是放在資料庫裏的,但是相同的資料庫,數據源不一樣相同,我們所取的數據一定保證數據源的一致,否則會造成數據混亂,比如說

  • 不同的數據存儲系統,mysol、oracle、sqlserver等等
  • 數據倉庫結構以及各庫表之間的關聯方式也可能有所不同,星型?雪花型?
  • 數據指標是否相同,名稱、含義、欄位類型、約束條件等等?
  • 是否經過了ETL處理,清洗規則是什麼樣的?

這些都是我們在進行數據提取之前所必需瞭解的。

那麼怎麼把數據取出來呢?

其實只要搞清楚了數據放在那裡,取出來就是水到渠成的事情。一般來說SQL是進行數據採集的必備技能,目前也是數據分析實際業務場景中最常使用的取數方式。當然了,能取出什麼樣的數據,也要看你是否精通sql,比如單張資料庫表的提取很容易就做到了,但是跨表查詢提取的時候很多人就不行了。再比如更為複雜一點的複雜查詢、聯機處理等等,這些做數倉的人用的很多,我們數據分析師不必設計這麼深,我們只要熟練掌握就行了

3、第三個關鍵詞是「數據」

這裡說的數據是廣義上的數據,包括資料庫中的數據,也可以概括為數據場景,也可以理解為經過清洗後的數據。總之,這個數據指的是我們可以直接拿來分析的信息,而不是一堆髒亂差的原始數據。

比如說數據場景,很多人都問我為什麼看資料看的好好的,一到實際業務場景中都歇菜了。只是因為在實際業務分析中,我們分析的不是數據,而是場景,那我們怎麼根據場景找數據呢?最重要的方法是建立分析指標體系;

我很喜歡用點線面體的定義來解釋指標體系,如果用點線面來解釋,搭建分析指標體系就是分析整個「體」,將分析框架的體系化,明確每個點都是什麼指標,任何一個分析路徑都能對應到指標。

以電商為例,我們在取數前遵循「人貨場」的思維邏輯,這就是我們的體,我們的大體指標框架。然後我們要找人貨場各自的業務邏輯,也就是場景,電商常用的業務分析場景有哪些呢?無非就是銷售、商品、渠道、競品、會員等等,這就是我們的面。而商品可進一步細分為商品的庫存、商品的利潤以及關聯銷售分析,這就是線和點。總結起來就是,在整個業務分析體系中,確保先分析什麼,後分析什麼,從體及線,從線及點,有了點,我們就知道該需要什麼數據了。

4、第四個關鍵詞是「分析手段處理」

這裡就是我們狹義上所說的數據分析了,根據實際場景需要可以分為四種:描述分析、統計分析、挖掘分析、建模分析,這一點是我們之後要講的核心內容,就是如何結合實際業務進行分析。

比如說描述分析,其實就是數據分析思維,其實業務很喜歡讓你做描述性的分析,因為不會用到演算法之類的東西,業務能看得懂,就能跟你扯皮。

比如說數理分析,基本要用到一些數理統計學基礎的分析方法,比如聚類、回歸等

第三個是建模分析,也就是數據分析模型,常見的一些有帕累託、漏斗模型等等

最後就是挖掘分析,基於我們的一些數據分析和挖掘工具,比如常用的excel和python,bi也有很多人喜歡用,因為比較簡單

5、最後一個關鍵詞是「業務價值」,這是數據分析最核心也是最終的目的

終於到了最後一個關鍵詞,業務價值。那企業是做什麼的呢?企業的作用是向市場提供產品或服務,為客戶創造價值。那我們數據分析就是為企業提供服務和產品,為企業創造價值。

業務會為什麼會找我們做數據分析?其實就是為了實現業務價值,價值體現在兩點:

一是將盈利時間拉長,一是將單位時間內盈利量做大。

第一點,需創造的價值讓越來越多的客戶知道並認可,獲得用戶粘性,從而實現持續增長,其實就是用戶體驗;第二點,需提高企業創造價值的效率。

所以我們要做的數據分析也要跟緊緊貼合這兩個點,這就要求我們在進行數據分析最後一步——數據可視化、數據報告等等時,要緊緊貼合業務,給領導或者業務最想看的數據

第二個問題是怎麼成為數據分析師?

還是一句話,先基礎、再業務、最後工具

1、先掌握數據分析的基礎思維、方法

做數據分析師十之八九都會面臨以下情景:「我們有一堆數,你分析分析吧,看看能有什麼結果。」

有經驗的分析師因為經驗老道,會清楚地知道從什麼角度分析,可以解決哪些問題,適用於哪些場景,預計產生什麼結果,會將業務問題轉化為數據分析問題。因此數據分析師要具備用數據分析思路和方法,具備分析思維來考慮問題的能力。

那作為小白,在沒有項目經驗時候,可以充分利用模仿技能,參考他人優秀的分析思路和方法。實際業務分析的大多數問題都是有前車之鑒可以學習的。很多分析已經是成熟的分析方法,例如客戶畫像,營銷提升,網站運營,信用卡評分,欺詐作弊等等。

學習領會他人的分析思路,轉化為自己的知識,是邁出分析的第一步。

當模仿別人的分析思路和方法時候,分析大方向已經確定了,具體部分需要結合自己的項目情況進行細化。如果只是簡單的數據匯總就能解決的問題就可以直接進入實操階段,但是如果發現需要運營一些複雜的分析方法,則不得不惡補專業知識。

例如做營銷提升,看到多數分析思路中都提到了產品關聯分析。什麼是產品關聯分析,需要具備哪些數據,用什麼演算法,結果怎麼應用,產品關聯分析適不適合你目前的場景,這些問題需要惡補分析知識才能回答出來。

2、熟悉業務知識

所有數據分析師都會告訴後來人「業務知識很重要」,因為大家在踩了坑之後才恍然大悟分析中遇到的很多難題問題都源於對業務的不瞭解。數據分析可以說是一門通用的技術,可以運用於各行各業,但是想在行業中成功則需要結合行業知識。

例如,同樣是對客戶進行分析,互聯網電商的客戶與保險客戶具有明顯區別,前者重視來源,活躍度,購買率,流失率,後者關注渠道,報價,理賠風險,投訴。業務知識包括這種大方向的行業知識,也包括公司內部特殊情況,瞭解得越詳細可以避免繞很多彎路。

例如,有些行為是內部人員參與的造成的數據異常要提前做處理,有些業務開展是帶地區特性的,分析時候要區分對待等。

3、分析工具

真正做分析時候,你會發現市面上有太多的分析工具,需要掌握的實在是太多了,其實不必糾結於此,依據個人能力,配合當前的數據分析環境,適用的工具自然會被選出。

數據分析過來人都會說80%的時間都在做數據處理工作,所以數據處理能力是必須的,簡單工具有Excel、SQL,複雜的有R,Python,Java。商業工具的報表finereport,SASS。

然後分析建模的能力,鑒於目前有豐富的演算法與成熟的模型調用機制包括商業軟體,開源工具等,多數時候僅需要懂得演算法原理,然後在實際中調用工具實現即可,不必驚慌。

最後是分析結果展示能力,如果是報告或報表則需要運用圖表,有效表達分析觀點,使分析結果一目瞭然。圖形的選擇、版式的設計、顏色的搭配等等,需要掌握一定技巧。


如果進行數據分析,背景、數據、目的都沒有,這個問題太寬泛了。

具體怎麼成為數據分析師,去招聘網站多看一些JD學會基本技能,然後在工作中結合業務使用精進,當然目標是解決問題。


數據分析在每個行業都需要運用到,尤其是涉及業務版塊的。數據分析又是一個外人看著很費力很複雜的事情,但是隻要找到分析的基本辦法,也是一件很容易的事情。如何進行數據分析,下面這幾點大家不妨參考一下!

北京聯科數信科技有限公司-長期招聘崗位?

mp.weixin.qq.com圖標

(本公司目前也在招一些數據分析師,關註上面公司公眾號,符合條件的可以投遞簡歷(可培養!!!),歡迎各位童鞋踴躍投遞!)

第一你要明白什麼是數據分析?

數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。這一過程也是質量管理體系的支持過程。在實用中,數據分析可幫助人們作出判斷,以便採取適當行動。

第二你要知道數據分析的目的:

目前世界500強企業中,有90%以上都建立了數據分析部門,為什麼要這麼做,數據隱含這價值,這就需要我們把隱藏在一大批看似雜亂無章的數據背後的信息集中和提煉出來,總結出研究對象的內在

第三、數據分析的分類

數據分析的三大作用:現狀分析、原因分析、預測分析。

第四、數據分析流程(如何進行數據分析):

1.明確目的和思路

首先明白本次的目的,梳理分析思路,並搭建整體分析框架,把分析目的分解,化為若干的點,清晰明瞭,即分析的目的,用戶什麼樣的,如何具體開展數據分析,需要從哪幾個角度進行分析,採用哪些分析指標(各類分析指標需合理搭配使用)。同時,確保分析框架的體系化和邏輯性。

2.數據收集

根據目的和需求,對數據分析的整體流程梳理,找到自己的數據源,進行數據分析,一般數據來源於四種方式:資料庫、第三方數據統計工具、專業的調研機構的統計年鑒或報告(如艾瑞資訊)、市場調查。

對於數據的收集需要預先做埋點,在發布前一定要經過謹慎的校驗和測試,因為一旦版本發布出去而數據採集出了問題,就獲取不到所需要的數據,影響分析。

3.數據處理

數據收集就會有各種各樣的數據,有些是有效的有些是無用的,這時候我們就要根據目的,對數據進行處理,處理主要包括數據清洗、數據轉化、數據提取、數據計算等處理方法,將各種原始數據加工成為產品經理需要的直觀的可看數據。

4.數據分析

數據處理好之後,就要進行數據分析,數據分析是用適當的分析方法及工具,對處理過的數據進行分析,提取有價值的信息,形成有效結論的過程。

常用的數據分析工具,掌握Excel的數據透視表,就能解決大多數的問題。需要的話,可以再有針對性的學習SPSS、SAS等。

數據挖掘是一種高級的數據分析方法,你需要掌握數據挖掘基礎理論,資料庫操作Phython,R語言, Java 等編程語言的使用以及高級的數據可視化技術。要側重解決四類數據分析問題:分類、聚類、關聯和預測,重點在尋找模式與規律。

5.數據展現

一般情況下,數據是通過表格和圖形的方式來呈現的。常用的數據圖表包括餅圖、柱形圖、條形圖、折線圖、氣泡圖、散點圖、雷達圖等。進一步加工整理變成我們需要的圖形,如金字塔圖、矩陣圖、漏斗圖、帕雷託圖等。

6.報告撰寫

撰寫報告一定要圖文結合,清晰明瞭,框架一定要清楚,能夠讓閱讀者讀懂纔行。結構清晰、主次分明可以使閱讀者正確理解報告內容;圖文並茂,可以令數據更加生動活潑,提高視覺衝擊力,有助於閱讀者更形象、直觀地看清楚問題和結論,從而產生思考。

好的數據分析報告需要有明確的結論、建議或解決方案。

數據分析的四大誤區

1.目的不明確,為了做而作,導致分析效果不明確;

2.對與行業、公司業務還有其他考慮因素認知不清楚,分析結果偏離實際。數據必須要結合企業業務和行業性質纔有意義。摸清楚所在產業鏈的整個結構,對行業的上游和下游的經營情況有大致的瞭解,再根據業務當前的需要,制定發展計劃,歸類出需要整理的數據。同時,熟悉業務才能看到數據背後隱藏的信息;

3.為了方法而方法,為了工具而工具,只要能解決問題的方法和工具就是好的方法和工具;

4.數據本身是客觀的,但被解讀出來的數據是主觀的。同樣的數據由不同的人分析很可能得出完全相反的結論,所以一定不能提前帶著觀點去分析。

每個人都有自己的工作方法,但是數據分析是個很有邏輯的工作,要做好數據分析一定要合情合理,邏輯思路一定要處理清楚,數據分析就要產生價值,只有做到這些纔算真正的做好了這份工作。

就先和大家分享到這裡,有其他問題的可以私信我或者加助理V,我看到了就會幫你解答的。


好的分析師要做好一個槓精。

很多分析師覺得我只負責收集整理數據以及解讀數據,至於你業務部門怎麼用,那是業務部門的事情。

這種「與我無關」的想法非常普遍,如果說劃清界限能夠讓自己的工作更加專註或者產出價值更大倒也還好,但是劃清界限的結果反而是會導致分析師的工作價值無法凸顯,最後形成自證預言,成為一個組織裡面的邊緣角色,組織的業務發展基本就與你無關了。

這種心態上的問題本質上是對分析師這個崗位的誤會,認為分析師主要和數據打交道就可以了,不需要與其他部門去溝通和交流,這種天大的錯覺在於「數據分析師」這個title帶來的錯誤引導。

數據分析師的重點一定不在於「數據」,而是在於「分析」,這是我說過很多遍的觀點,只是因為現在信息爆炸,數據足夠多,需要有人去條分縷析地將數據給整理出來,所以纔出現了專門的「數據分析師」。

但是如果你專註於「數據整理」,那麼本質上跟傳統製造業流水線上的工人沒有什麼區別,只不過工人們處理的是實物,而分析師處理的是虛擬的數據,「智能製造」都拉開大幕了,定位於流水線上的數據分析師被淘汰還會遠嗎?

當然也不用過於恐慌,雖然我認為數據分析師只是一個過渡崗位,但是現階段依然是一個不可或缺的角色。作為個人我們所要做的就是在被淘汰之前如何提升自己的全局思維能力,讓自己能夠跳出「數據」的桎梏。

不要讓自己「只見樹木不見森林」,關注鏈條上的上游和下游。

在需求方跟你提一個數據需求的時候,多問兩句,為什麼會產生這個需求,他的思考邏輯和鏈條是什麼樣的。但是其實很多時候需求方自己也沒想很清楚,於是這種時候就要跟他一起把這個鏈條捋清楚。

這裡有一個很簡單的方法,多問幾個「然後呢?」,做一個惹人嫌的槓精。

需求方:幫我看一下昨天X數據表現怎麼樣吧?

分析師:我看了然後呢?這個數據之後對於你們的策略有什麼指導嗎?需求方:你先分析啊,分析完不就知道有什麼幫助了。分析師:假設我現在分析完了,數據表現很好,然後呢?你們會做什麼?需求方:那就說明我們前段時間的A策略很有效,接下來需要進一步推廣執行。分析師:具體是什麼策略?決策思路是什麼?為什麼你們覺得A策略會影響X數據呢?需求方:……分析師:或者數據表現很差,然後呢?你們會做什麼?需求方:那就說明我們前端時間的A策略效果不好,接下來需要調整策略。分析師:為什麼X數據不好就一定是A策略的問題呢?你們同期有做別的事情可能影響X數據嗎?需求方:……

然後就不會有需求方再來給你提需求了。

開個玩笑,凡是經過你這樣一番追問之後還能給出自圓其說的思考的需求方,纔是靠譜的需求方,同時你也能夠知道你給出了分析之後對於下游鏈條的影響。

而那些答不上來的,說明他們自己也沒有想清楚,為什麼要給他們做分析呢?


野生分析師,主要在電商和酒店行業,歡迎交流,關注我的微信公眾號(西城慢慢爬)。


推薦閱讀:
相關文章