獻給踏上數據分析這條不歸路的小朋友。本文引用了很多知乎上的公開回答,我做了簡單整理和提煉。

1.你要做的是哪種用戶畫像

user persona和profile在中文裡都叫用戶畫像,但他們是兩種東西。

Persona是從海量用戶中提煉共同特徵,再用其中最典型的用戶特徵總結成一個個虛擬的角色。

Persona的例子:

在產品早期和發展期會較多地藉助persona,幫助設計、產品人員理解用戶的需求,想像用戶使用的場景,產品設計從為所有人做產品變成為三四個人做產品,間接的降低複雜度。

本文不討論persona的創建過程,推薦知乎這篇文章 zhuanlan.zhihu.com/p/30

Profile是和數據挖掘、大數據息息相關,通過數據建立描繪用戶的標籤。

這裡又分個人profile和產品profile。

個人profile的例子:

例如你追一個女生,你可以這樣給她貼標籤

基本信息:張倩、23歲、成都人、168cm

職業:設計師,月入2萬

外在:膚白貌美、前凸後翹、五官精緻、長發飄飄、大腿修長

興趣愛好:喜歡撞球、逛街、看電影、旅遊

社交信息:辦護照、問雲南麗江旅遊攻

知道這些信息,你是不是就可以有目的的投其所好,然後開始你的追求計劃!

產品profile的例子:

產品profile是對一群人貼標籤,是對一群人共性特徵的提煉。

例如你搜索p2p,就會出現p2p的用戶畫像:主要集中在北上廣深,年齡主要集中在20-39歲,且以男性居多。那麼你要開一家p2p公司的時候就要選在北京、上海、做運營推廣的時候主要找20-39歲的人群。

profile主要用於產品成型後在成長期的精準營銷和運營。

本文主要對產品profile進行探討。個人profile的創建過程可以參見知乎這篇文章zhihu.com/question/1985

2.如何創建產品profile

主要分為5個步驟

  • 確定目標
  • 搭建分析框架
  • 採集數據
  • 假設與驗證
  • 編寫報告

1)確定目標

profile一定是為某個具體的商業目標而創建的。創建profile並不是一個目標。如果你不知道創建profile做什麼用,請找你的老闆問清楚,如果他也不知道,幫他梳理清楚。因為不同的目標,用戶畫像的做法會有所差異。

舉一個租房分期產品的案例,接下來我也會以這個例子展開每一步。

老闆說我想看看我們逾期用戶的用戶畫像。他為什麼要看逾期用戶的畫像?如果只是看看逾期用戶的年齡構成、城市分布等這類數據能產生實際的價值嗎?我猜想老闆其實想知道的是逾期用戶和正常還款用戶有什麼區別!只有這樣才能對逾期用戶制定針對性的風控策略。和老闆確認後確實如此,所以本次目標確定為:對不同還款表現的人群profile在各個維度進行比較

2)搭建分析框架

我們需要從各個維度去認識用戶,為了不遺漏一些重要特徵,我們可以通過思維導圖,把需要分析的信息進行分類和梳理。一開始可以把信息項羅列的全一些,然後做減法。當然也要預先判斷系統中是否能夠取到這些數據。

3)採集數據

如果自己不是數據工程師,這裡就有一步把數據需求落地的過程。上一步設想的信息項需要明確的定義,否則數據人員無法按照你想的把數據準確的拉取出來。拉取過程中可能會遇到數據歧義、缺失、無法按照你要求的維度統計等等問題,我們需要靈活變通,根據情況調整定義或者去除。

另外,需要準確記錄數據採集的時間、樣本範圍、樣本數量等,因為很多數據是動態的。

4)假設與驗證

這是讓數據產生價值的一步。用戶畫像的價值不是證明大家已經知道的東西,而是挖掘出大家不知道的、和預想不一致,甚至有悖常理的現象。

我們假設:逾期用戶的房東體量比正常還款用戶的房東體量要小,因為小房東更容易受到誘惑配合用戶騙貸。

為了驗證這個假設,我們首先根據當前最長逾期天數來把用戶劃分成逾期用戶和正常還款用戶兩個人群。然後我們分別觀察這兩個人群下房東體量的分布,看看是否有差異。如果逾期用戶的房東體量>300間的佔比明顯小於正常還款用戶,說明假設成立。

其實在搭建分析框架時,腦海里就應該有很多假設了,否則到時候就沒有數據進行驗證。如果有時間,每個信息項都應該進行這樣的假設和驗證,說不定有意外的發現。

5)編寫報告

最後就是成果展示了,你的所有假設和驗證都需要通過報告的形式向別人展示。我們的目標是把我們得到的分析結果講清楚。一般來說,profile報告是由一組組「結論+圖表」和人群總結組成。

下面是一個「結論+圖表」的例子,一個好的圖表就是能讓觀眾清晰的從圖表中得出展示的結論。

什麼樣的圖表適合說明什麼樣的問題可以看看這篇文章www.zhihu.com/question/37359184

而人群總結一般可以這樣寫:

  • 逾期用戶是這樣一群人,主要集中在華東地區二線城市,年齡兩極分化,支用金額偏大,房東體量偏小,租房租金不規律,人長得丑。
  • 正常還款用戶自然分布在一二三線城市,年齡在25-35歲之間,支用金額自然分布,房東體量較大,租房租金和幾線城市正相關,人長得美。

推薦閱讀:

相关文章