在我們與數據打交道的過程中,最常見也是必不可少的工作之一就是對指標的異常變化進行解釋和分析,因此,不僅僅需要分析下跌的原因,也要解釋增長類數據的成因。例如,官網流量突然上漲,是為什麼?註冊轉化率明顯下降,是什麼因素造成的?總交易額大幅增加,是採取了什麼動作等……

可見,做好異常數據分析很可能會為產品、業務,或者公司帶來額外驚喜。那我們該如何做好數據異常的分析呢?今天數獵哥就來給大家分享一下。

一、數據異常有哪些表現

從統計學的角度來看,我們會對數據異常進行界定:日常工作中的流量數據、用戶數據、轉化數據、交易數據都有固定的波動週期,每個週期內的數據變化應該是趨於穩定的,如果某天的數據不在符合預期的範圍內穩定變化就是數據異常。對數據異常的敏感度主要有:數據波動是否為異常?異常的範圍、波動的程度,是否需要深入分析。

二、為什麼要做數據異常分析

弄清楚數據異常波動背後的原因,不只是為了回答老闆或者業務方的問題。首先,對於產品的各種數據知其所以然,是對數據分析師

的基本要求;其次,通過數據異常分析往往能夠發掘背後隱藏著的未知機會或風險,這些機會和風險往往是我們平時容易忽略的,這對產品的持續優化具有重要意義。

例如,我們可以通過一次次的數據異常分析來明確造成數據波動的原因,深入瞭解影響業務表現的各項內部、外部因素,建立日常的的運營工作和數據波動之間的聯繫,同時依據因素權重大小從而找到促進數據增長的方法。

最後,我們還可以建立異常因素庫,將日期、發生的事件及對應的數據影響記錄下來,以便更快的複製成功的經驗,避免更多的失敗。

三、如何做數據異常分析

1.覺察異常問題

既然是數據異常分析,那麼我們首先必須能覺察到這些異常,而這個過程往往依靠豐富的經驗和對產品與業務的充分了解,也就是數據敏感性。一旦我們有了這種敏感性,只要藉助基本的數據可視化報表,就能夠立刻覺察異常。

這裡需要注意的是數據敏感不是一個「硬」技能,也很難說有具體的操作步驟去提高數據敏感性。有些人邏輯性強,通過數據本身的相對關係就能夠發現異常的存在,比如DAU和轉化率都有提升而交易額呈下降趨勢;而大部分人是通過平時對產品的日報、周報、月報數據進行詳細分析,經過長期的主動訓練做到對業務有足夠深的理解來提高數據敏感性。這也是為什麼有經驗的人更容易發現異常的原因。

2.定位與界定問題

當我們覺察到異常問題後,下一步就要進行分析或解釋,但是我們首先需要把問題界定與描述清楚。例如「昨天的App的註冊量怎麼下降了」,這個數據異常是否確實存在,即數據是真的下降了,還是受到了其他指標波動的影響,這個波動範圍和程度是怎樣的、對應哪段時間點、是否有必要花時間深入分析。

如果問題沒有界定清楚,那後續的數據分析也只會在錯誤的道路上越走越遠。這裡提供以下幾個方面幫你定位異常問題:

(1)確認數據源是否有誤

例如一份周報或者月報,數據是從資料庫中導出,如果從資料庫中導出的數據都是有問題的,那最後在報表呈現的數據自然也是不準確的。

(2)統一口徑或業務邏輯

統一口徑包括兩個方面:①數據分析人員與業務人員②數據分析人員與開發人員。這裡數據分析師在中間起著很重要的作用,能不能把業務語言準確的轉化成資料庫語言至關重要,如果相關人員對統計指標的理解不一致,就會導致最後不是初始想要的數據。

(3)統計結果偏差

通常最大可能犯錯就是具體的數據統計過程中的錯誤,比如說是不是函數公式中選定的區域有誤,或是看錯行,很多細節都有可能造成統計偏差。

除此之外,我們可以通過排除一部分明顯的內外部因素減少工作量。例如,外部因素:節假日,行業動態、相關熱點事件、政策法律的變動,運營商網路狀態等;內部因素:市場、運營活動的影響,產品功能上線,數據上游調整等。

3. 數據異常分析

如果數據異常經確認確實存在,那麼你就要去找原因了。這個找原因的過程總結起來就是「大膽設想,小心求證」,大膽設想就是對異常產生的原因做出合理的猜測,回顧所有產品相關的信息,然後猜測一個可能造成數據異常的原因。小心求證是說在做出猜測之後,我們需要對自己的猜測負責,找到能夠支持(或者否定)這種猜測的數據。

(1)大膽設想

大膽設想不是天馬行空,而是有方法可以遵循,這裡給大家介紹三個方法:業務拆解法指標推進法用戶行為分析法

①業務拆解法

我們可以從兩個維度來對業務進行拆分,如圖所示第一個維度是產品、競品、大環境;第二維度是產品、技術、用戶和運營。前者是因為相互競爭的產品都處於大的業務環境之中,任何一方的變動都會造成自家產品的數據變化,後者是基本概括了互聯網產品的重要構成,往往數據異常逃不出這幾個方面。

②指標拆解法

為先對異常指標進行拆解,確保指標拆到最細顆粒度的指標,如圖所示的杜邦分析法,然後通過對比前後2個時間段上最細顆粒度指標的變化,評估哪一個指標的波動對這個指標的波動貢獻度最大。

③用戶行為分析法

我們可以先了解產品的運作邏輯,主要關注的是用戶角色、信息和渠道,以及他們之間的流轉關係是什麼樣的;然後瞭解業務邏輯,指的是要執行某個業務,用戶角色需要走過的路徑,會有什麼角色參與,有什麼功能模塊;最後是在此基礎上繪製出用戶使用產品的行為旅程,然後評估各個行為流程節點的異常。

(2)小心求證

通過前面三種方法,我們已經列出了數據出現異常的原因,接下來就需要對數據進行一定的推理,找到直接或間接的證據來證明。對於大環境維度的數據異常原因猜測,一般可以獲取一些能夠反映大市場的數據來證明,比如OTA網站DAU在某月降低幅度很大,我們猜測是因為旅遊淡季開始,這時候可以去百度指數看看「酒店」或「酒店預訂」搜索熱度的變化,或者查查往年此時的旅遊消費數據,就可以驗證我們的猜測是否準確。

而對於自身產品的求證主要是對比細分的分析方法。這裡的對比為基準對比分析,選取數據變化前後可對比的時間段進行對比就可以。而細分的分析維度比較多,我們只要找到該原因所代表的細分對立面做對比,就可以證明我們的設想,下面介紹一些常見的細分維度及其案例。

①分步:假設某產品的轉化率數據出現降低的情況,而這個轉化率是多步漏斗轉化的最終轉化,我們可以細分每一步的轉化情況,查清是否因為某一步出了問題。比如微信支付伺服器的故障會造成下單到支付的轉化降低從而造成轉化率降低,列表載入速度增加造成列表到詳情轉化率降低影響整體轉化等等。

②分版本:假設某產品列表頁到詳情頁的轉化提升,我們猜測是iOS新版本中優化列表佈局方式,我們需要分iOS和Android以及分iOS新版老版對比這個轉化數據來證明我們的猜測。

③分區域:假設某年8月31日某OTA的交易額呈現大幅增長,我們猜測是因為大學生開學造成酒店需求增加,這時我們可以選取部分高校較多的城市如北京、武漢、西安等城市的數據來對比其他城市來側面驗證我們的猜測。

④分時間:假設某日某產品轉化率數據下降,我們猜測是10:00-11:00支付伺服器故障造成的,那我們只需要分時間段和上一個波動週期同期的數據對比,如果當日這個時間段轉化率確實下降很大,就可以證明我們的猜想。

⑤分用戶羣:假設某App新版上線之後新版轉化率低於舊版,經過用戶分析發現新版新用戶比例較大,我們猜測新用戶轉化率會比老用戶轉化率低,這個時候我們只需要看一下新老客戶的轉化率區別就能知道我們是否蒙對了。

⑥分場景:假設某App在某假期內轉化率降低,已知異地用戶轉化率低於本地用戶轉化率,猜測假期轉化率降低是因為異地用戶較活躍造成的,這個時候,我們只要需要去看看本異地用戶佔比的變化就可以驗證猜測了。

⑦分事件:假設某OTA轉化率在某段時間內明顯提升,而這個時間段恰好是競對較少補貼促銷活動的時間,我們猜測是競對促銷活動終止對產品轉化率造成了正面影響,如果我們查看數據證實那些被競對取消促銷的事件轉化率提升明顯,那說明我們的猜測是對的。

經過了以上複雜的「假設-驗證-細分-再驗證」的步驟之後,我們找到了影響數據指標異常變化的因素,但這裡的因素可能是一,也可能是多個。如果是多個因素,我們就需要通過加權重的方法衡量影響力大小,同時判斷這些影響因素加起來是不是完全等於這個指標變化的幅度。最後對於關鍵影響因素需要抓二八定律,優化業務。

四、注意事項

1. 避免常見錯誤

我們在做邏輯推理過程中,需要做到推斷合理,避免常見的錯誤,比如相關性並不能表明因果關係、缺失對比對象、基於個案來推總體。同時在避免常見的邏輯錯誤的同時,也要敢於下結論,雖然結論有可能是錯的。

2. 提出切實可執行的方案

數據分析的終極目的是對業務改進產生價值,基於此,分析結論之後一定要提出切實可執行的方案,即落地到業務和產品上的具體建議,確保方案可執行,效果可評估。分析報告完成之後,一定要多與業務部門進行溝通,收集反饋,聽取他們需要的是什麼?一起商討解決方案。

作為分析師也要不斷反饋自己,如何改進才能更有效的與業務結合?在完成了以上定性分析和定量分析之後,別忘了將以上過程進行總結梳理,當然也是為了給領導或者業務方一個交代:數據異常分析報告。一份完整的數據異常分析報告應該包括以下部分:

①問題描述:什麼時間,什麼指標,是上漲下降,幅度是多少,對比的是什麼;

②主要結論:將影響因素按照影響度從大到小講清楚,並列清楚各自的影響度;

③後續跟進:異常因素髮生的原因是什麼,後續的解決方案是什麼,解決時間;

④具體分析過程:具體的分析過程及詳細數據。

注意上述各部分的順序,一定要先講清楚我們要分析的問題是什麼,將問題講清楚;之後就是結論,將結論列在前面,方便一些沒時間看或者不關心具體過程的人看到;一定要有解決方案,不要只把問題列出來,要有後續的解決方案。

五、小結

在日常數據分析工作中,數據異常是很常見的現象,我們可以通過對自身業務的理解來覺察異常數據,然後再界定與定位異常問題,其次通過業務拆解法、指標推進法和用戶行為路徑法來提出假設,最後運用對比與細分的方法來驗證。遵照這個流程,一般能夠找到數據異常的深層原因。

當然,這個過程需要花費大量的時間和精力,但經過這個過程我們能加強數據的敏感度,更全面深入地瞭解自己所負責的產品,形成一個良性循環,讓我們能運用數據分析更快地提高業務能力。此時我們還可以藉助可視化工具,例如Data Analytics,可一鍵接入Execl/CSV等數據文件,無需編程僅需簡單的拖拽即可製作酷炫的數據可視化看板,用直觀的數據幫你做更好的決策。

本文中所有圖表都是藉助Data Analytics軟體免費版做出來的。想嘗試自己做圖,點擊「閱讀原文」即可學習如何製作,記得先註冊哦~

以上數據經過脫敏處理,使用Data Analytics數據可視化軟體製作。

-數據分析展示就用DataHunter

關於 DataHunter

DataHunter 是一家專業的數據分析和商業智能服務提供商,註冊於2014年。團隊核心成員來自 IBM、Oracle、SAP 等知名公司,深耕大數據分析領域,具有十餘年豐富的企業服務經驗。

DataHunter 旗下核心產品智能數據分析平臺 Data Analytics、數據大屏設計配置工具 Data MAX 已在業內形成自己的獨特優勢,並在各行業積累了眾多標杆客戶和成功案例。

成立以來,DataHunter就致力於為客戶提供實時、高效、智能的數據分析展示解決方案,幫助企業查看分析數據並改進業務,成為最值得信賴的數據業務公司。

歡迎關注公眾號:數獵天下DataHunter

-數據分析展示就用 DataHunter-

手把手教你免費使用數據可視化軟體?

www.datahunter.cn


推薦閱讀:
相關文章