摘要:谷歌紀念品商店(Google Merchandise Store)是銷售谷歌紀念品的在線網站。2018年10月的Kaggle Featured Prediction Competition使用了2016-2018年Gstore的歷史數據集來預測2018/12/01-2019/1/31的客戶交易收入(Transaction revenue)。這一網站的經營數據同時可以在Google Analytics中作為demo項目來練手。本文使用Google Analytics做一個探索性分析(EDA),發現Gstore的轉化率只有2.38%(以總會話數為基準),核心消費群體為Google員工。

2018年10月開始的Kaggle Featured Prediction Competition是關於預測谷歌紀念品在線商店(Google Merchandise Store)的交易收入(Transaction Revenue)。那麼問題來了,這個沒怎麼聽說過的商店是什麼樣的呢?

商店裡出售的是各種印有Google Logo的周邊商品

點開網站一看,原來是出售各種Google周邊紀念品的。這麼小眾的商店,似乎只有Google的死忠粉會關注吧。既然筆者在此立了Flag,那麼就用數據來做一個探索性分析。

在此次Kaggle競賽中,最終所用的數據集如下圖。在這次比賽的Kernel頁面中,有諸多大神用Python和R寫了很多非常好的探索性分析腳本。而這些數據同時也可以在Google Analytics中使用Google Merchandise Store Demo Account做可視化分析。所以這次我就用Google Analytics做個練手,分析一下2016/08/01-2018/04/30(對應train_v2.csv的時間段)的數據。

文件描述

Kaggle競賽數據集中的變數如上圖所示,包括了visitId(每一次會話的Id),fullVisitorId(用戶Id)。一個用戶多次訪問,就會產生多個visitId。因此下文分析的會話數指的就是Visit的總數。

會話(Session)與網頁瀏覽量總數

Kaggle網站上訓練集的樣本數為1708337

在Google Analytics中,可以看到會話總數為1,829,632。而訓練集中的會話總數為1,708,337,比前者少了6%。這可能是因為競賽所用的數據經過了清理,不過這並不會對本文的分析有太大的影響。

訪問網頁的時間特徵

所有會話數的月度趨勢(每月總會話數)

從每月會話數的趨勢來看,下半年的訪問數相比於上半年呈現增加的趨勢,尤其是集中在9-12月。16年11月的會話數是數據集包括的時間段內的最高值。

所有會話數的每周趨勢(每周總會話數)

然而將粒度細化到每周的會話數,又可以觀察到某些月份內的更具體的變化趨勢。17年的9-12月除了整體訪問量走高以外,在某幾個時點呈現出尖峰。

16年11月每日訪問數逐漸走高,在11月28日達到高峰,進入12月開始下降

17年年底訪問的高峰出現在12月13日左右

無論是16年還是17年,每日訪問數的高峰都出現在11月末12月初這一時段。考慮到美國的商店集中在感恩節到聖誕節期間開展促銷活動,也許這期間的訪問高峰是由於Gstore的某個促銷活動所致。

同時,在天數這一粒度上的時間趨勢上,觀察到每一周內有著訪問高峰和低谷,並且在周間有著相似的規律,我們接下來看一下用戶在周內的平均訪問數。

每周幾和每小時的平均用戶數

有趣的是,Gstore的訪問用戶更加集中於工作日,並且集中於上午8點-下午2點間(上班逛網站)。似乎訪問Gstore的用戶的工作氛圍更加自由。

18年3月4日(周日)-18年3月18日(周日)之間的每日會話數

此處將18年3月4日-18年3月18日(兩個完整的周)的每日會話數拿出來單獨分析。依然可以觀察到周一至周五的訪問數較高,到了周末則呈現下降的趨勢。

接下來,我們將所有的會話數分為帶來交易的會話(交易額大於0)和交易額等於0兩組,來具體比較兩組在訪問來源、地理位置、和瀏覽頁數等方面有什麼特徵。

帶來交易/交易額等於0的會話

帶來交易的會話只佔總數的2.38%,看來高達97%以上訪問都是只看不買。

在發生交易的43000多個會話中,大部分的瀏覽頁數都大於8次(18245/43505),有41%的用戶瀏覽頁數超過了20次。當某次會話發生交易時,訪問者已經訪問了多個頁面(當然了,進入購物車頁面和結賬頁面也會使得發生交易的會話頁面數更多)。

大約50%(883429/1786127)的未發生交易的會話僅僅訪問了1個頁面。絕大多數未發生交易的會話訪問頁面不超過10頁。當然了,還是有2.4%的會話訪問頁數大於20頁。也許有的人在精挑細選後最終做出了不買的決定。

發生交易/未發生交易會話的一些平均指標

帶來交易/交易為0會話的訪問序數(對應數據集變數Visitnumber)

在Kaggle競賽的數據集中,Visitnumber表示這次會話是用戶第幾次訪問網站。

對於發生交易的會話來說,第1次訪問就發生交易的比例為35%。可見儘管帶來交易的會話占會話總數的比重很小,然而第1次訪問網站的會話基數很大,使得訪問1次就購買的會話占帶來交易會話的比重也很高。同時,會話次數在2-25次的比例相比於交易為0組也要更高。

對於交易為0的會話來說,多次訪問會話的比例相比於帶來交易的會話就要低很多。

使用設別/操作系統與瀏覽器

個人電腦的使用比率高達70.5%!這和前面「工作日和上午的平均用戶數更高」這一結論不謀而合,原來上Gstore的人更多的是在工作日的上班時間、用桌面上的電腦刷著Gtore!而移動設備和平板電腦的比例只有大約四分之一。看來Gstore的主要用戶群的確是比較有特點~

在操作系統上,Windows佔據了頭名位置,其次是Mac。手機ios中iOS和安卓分別是第一和第二。

瀏覽器的頭名是Chrome,比例高達66.56%。其次是mac,比例為19.30%。不難想像,Google粉絲應該佔據了用戶群的大頭。

訪問渠道(Channel Grouping)

了解客戶訪問網站的渠道對於網站的流量分析有著重要的意義。網站的訪問渠道可以分為以下幾類:

  • Organic Search: 網站不付費給搜索引擎做廣告,而讓網站使用者通過搜索引擎「內在」搜索功能而找到網站
  • Direct: 瀏覽器中直接輸入網址到達網站
  • Referral: 推介網站,除了organic以外其他網站帶過來的流量
  • Campaigns: 市場投放活動,常見的是付費關鍵詞Adwords
  • Social: social media,即通過點擊FB Twitter Wechat等社交媒體的文章視頻等作品含的鏈接
  • Paid Search: 付費搜索

對於交易為0的會話而言,42%的來源為自然搜索,其次是社交媒體、直接訪問和推介網站。

而發生了交易的會話中,59%的渠道為推介網站,直接訪問和自然搜索其次。不禁令人好奇,那些從推介網站訪問Gstore、發生交易的會話是從哪些網站訪問的。

用戶地理位置

所有用戶中美國的用戶佔了約45%,排名第二的印度僅占不到10%。我們接下來看一看用戶在城市層面的分布。

很明顯,地圖中顏色最深的是美國的西海岸,其次是美國東北部。而歐洲城市的分布相對均勻。亞洲、大洋洲和南美的城市圓圈較少,而且顏色比較淺。

所有會話的城市佔比

在所有的會話中,有6.81%的城市沒有獲得定位,我們無法從中獲得有價值的信息。排名第二的是矽谷的山景城(Moutain View),是Google、Mozilla等科技公司的所在地。而舊金山、Sunnyvale、San Jose都毗鄰Mountain View。看來矽谷這一地區是Gstore用戶的第一大來源,其次是紐約市。而倫敦是歐洲用戶最多的城市。

發生交易會話的城市佔比

在發生交易的會話中,山景城的佔比為13.67%,排名首位。

來源(Source)

交易為0的會話中,有45%的流量來源於google,其次是谷歌的子公司youtube的18%。有17.16%的流量為直接訪問流量。有趣的是,排名第4的流量來源為mall.googleplex.com。輸入這個網站的網址,看看這個網站是做什麼的:

額。。。居然是谷歌公司的內部網站,其域名googleplex就是谷歌公司總部的名稱。原來訪問Gstore的人裡面有相當一部分就是谷歌的員工。

我們再來看一下發生了交易的會話。其中來自於mall.googleplex.com的會話數佔了30.71%,排名首位。其次是直接訪問和google搜索的。第四名的網站來源是gdeals.googleplex.com的,並且佔比15%。從域名上看這似乎是谷歌內部網站,並且與打折有關。相比於只看不買的會話來說,谷歌內部網站的訪問來源在發生交易的會話中佔比更高。這裡可以做出一個猜測:谷歌員工是在Gstore上消費的重要群體。結合前面對網站訪問時間分布的分析來看,一種可能的場景是:在Google這家以工作氛圍自由知名的公司里,也許員工們在上班時間,通過內部網站的鏈接跳轉到Gstore的頁面,並且在若干次的瀏覽以後,最終購買了一些帶著logo的周邊商品。

結論

通過對Gstore數據集(2016/08/01-2018/04/30)的探索,有以下的發現。

  • 帶來交易的會話只佔會話總數的2.38%,看來高達97%以上訪問都是只看不買。
  • 從會話訪問的時間趨勢來看,9-12月是網站流量走高的時段。網站的流量在一周內呈現出周期性:工作日要高於雙休日。工作日內上班時間內的平均流量更高。
  • 發生了交易的會話中,平均網頁瀏覽量要更高,會話為多次訪問的比例也要高於交易為0組。這說明發生了交易的用戶更傾向於多次訪問網站,並且每次訪問網站會瀏覽更多頁面。
  • 桌面設備是所有訪問會話的主要使用設備;Windows、Mac以及Android是排名前三的操作系統;Chrome瀏覽器在訪問瀏覽器中有著絕對的優勢。
  • 未發生交易的會話中,自然搜索訪問佔比最高;發生交易的會話中,推介網站的訪問來源佔比最高。
  • 用戶主要來源為美國;城市的首要來源為矽谷的幾個城市以及紐約
  • 從訪問的來源網站來看,交易為0組主要來自於Google自然搜索和youtub;發生交易組中,谷歌內部網站以及直接訪問是首要的來源。谷歌的員工是Gstore的重要消費群體。

參考文檔:

Google Analytics Customer Revenue Prediction

Google Merchandise Store

10分鐘學會看懂谷歌分析(Google Analytics),營銷達人就是你

推薦閱讀:

查看原文 >>
相关文章