台湾 || 语言: 大陆简体港澳繁體台灣正體

基於pandas的「黑五」數據分析

雪花台灣 2019-04-10 12:24

文章結構

一、分析背景

二、數據來源及數據理解

三、分析框架

四、數據清洗

五、數據分析

六、結論與建議

一、分析背景

在美國，自1941年起，感恩節是在每年11月的第四個星期四，並從這一天起將休假兩天。像中國的春節一樣，在這一天，成千上萬的人們不管多忙，都要和自己的家人團聚，享受和家人共進晚餐的時光。

而享用完感恩大餐，人們最感興趣的事情就是去商店搶購特價商品。美國人將感恩節後面的星期五叫做Black Friday（黑色星期五）。

這一天是美國人購物最集中的一天。各大零售商都為了每年的打折季促銷準備了充足的「彈藥」，蠢蠢欲動等待著買手的圍攻，是全年折扣力度最大的時候。所以也可以把這一天稱為國外的「雙11」。

二、數據來源及數據理解

數據集來自於kaggle，共有537578行，12列。

每一列的欄位含義如下：

User_id：用戶的唯一標識符
Product_id：商品的唯一標識符
Gender：性別，F表示女性，M表示男性
Age：用戶所屬年齡段
Occupation：職業，共20類職業，用數字進行表示
City_Category：城市類別，共分為A、B、C三類
Stay_In_Current_City_Years：在該城市居住的年數
Marital_Status：婚姻狀況，0表示未婚，1表示已婚
Product_Category_1：商品類別，不能為空
Product_Category_2：商品類別，可以為空
Product_Category_3：商品類別，可以為空
Purchase：購買的總金額

三、分析框架

電商領域的數據分析採用基於人—貨—場的理解來進行，具體分析框架：

相关文章