數據分析的流程:

  1. 明確需求與背景
  2. 數據獲取
  3. 數據清洗
  4. 數據分析
  5. 數據可視化
  6. 輸出報告並提出可落地方案
  7. 協助方案落地並觀測後續進展

具體講解:

一、明確需求與背景:在數據分析開始之前,一定要先明確做這次分析的目的和背景是什麼,這樣才可以保證數據分析的準確性以及最後輸出結論建議的有效性和可落地性。不要為了數據分析而分析,因為這樣大概率會成為自嗨式分析,業務方看到你輸出的結論之後不是說:「你得出的結論我早就知道了」就是「你不了解業務情況","你的分析沒有價值」等等。(主要技能:溝通能力/業務理解能力)

數據分析主要分為三類

a.現狀分析又叫描述性分析(告訴你過去發生了什麼):主要通過各種運營指標的完成情況來衡量公司的運營狀況,以顯示公司的整體運營情況是好是壞,它的表現如何?

b.原因分析 (告訴你為什麼這些現狀會發生):在對第一階段的現狀進行分析之後,我們對公司的運營有了基本的了解,但是我們不知道哪裡的運營更好,差異是什麼,以及原因是什麼。通過原因分析,可以得出有效結論,幫助業務知道導致現狀的主要原因是什麼,以及如何提升現有業務水平。c.預測分析(告訴你未來會發生什麼):了解公司運營的現狀後,有時需要對公司的未來發展趨勢做出預測,為公司制定業務目標,並提供有效的戰略參考和決策依據,以確保公司的持續健康發展。

二、數據獲取:在了解了需求與背景之後,才開始獲取數據,看看資料庫是否有該指標數據,然後明確指標數據的口徑,如果沒有該指標數據看看能否用其他指標代替,是否涉及到爬蟲等等。(主要技能:SQL/爬蟲)

三、數據清洗:在數據獲取過程中,內部的數據往往質量較好,但是外部數據,比如爬蟲獲取的數據,數據大部分為「臟數據」,需要進行進一步的數據清洗,包括補全缺失值、刪去異常值、重複值、進行數據轉換等等才可以使用。(主要技能:Excel/Python)

四、數據分析:在數據準備好之後,才開始進行數據分析,結合需求與背景,選擇合適的分析模型或方法。(常用的數據分析模型與方法:RFM模型/SWOT模型/AARRR模型/邏輯樹/假設檢驗/相關性分析/對比分析/主成分分析/交叉分析等等)

五、數據可視化:通過有效的數據分析得出一定結論後,還需要用合適的方式展現出來,俗話說得「字不如表,表不如圖",合理運用圖表可以更清晰展現,使受眾更加容易理解你得出的結論。(主要技能:Excel/Python/R/power bi/tableau)

六、輸出報告並提出可落地方案:按照需求與背景,結合分析框架,按照一定的邏輯結構撰寫好數據分析報告,但在直接向業務方交付之前,應該先找個業務同學聊一下,看看數據是否異常,建議與結論是否合理,先進行初步評估,然後進一步修改完畢後,形成報告給業務leader。(主要技能:邏輯能力/PPT能力/溝通能力)

七、協助方案落地並觀測後續進展:數據分析報告中的結論與方案得到業務方leader認可之後,開始推動並協助方案落地,並進一步觀測相應的數據指標是否按照預期提升,及時發現問題及時矯正,這樣才能形成一個完整的數據分析閉環。(主要技能:協調能力)


個人經驗:無論多麼猛如虎的騷操作,什麼立意立場,什麼可視化或者結論都沒有任何用。數據分析的第一步一定要是:你要幹什麼(分析目的是什麼),關注我文章,有些小經驗分享


先看你想分析什麼,再看現有數據滿不滿足,處理數據,建模不就行了


從數據可視化與數據探索開始


查文獻,定方向


先從磁碟讀到內存再說~


1.首先看這數據是否全面,能否滿足你的要進行的分析需求

2.數據質量查看是否存在缺失值異常數據等

3.數據處理異常數據、缺失值處理進行數據清洗達到可使用狀態

4.根據分析思路對數據進行分析


推薦閱讀:
相关文章