近期從公眾號「猴子聊人物」後臺資料處獲得一份口紅銷售數據,想從幾個方面通過分析口紅銷售情況,以瞭解人們對口紅的需求。

一、研究問題

1.銷售量前10%的口紅在評分、功效上有什麼特點?

2.售價對銷售量的影響如何?

3.對於國內外口紅的需求情況有什麼偏好?

二、數據清洗

打開Excel表格,刪除重複項,指定數據類型,刪除暫時不用的商品描述,另外價格處有顯示為「¥19.00~¥55.00」的進行分列處理。因為MySQL中列名如果是中文不太方便,故在Excel中更改列名,最終列名對應中文如下圖。

接下來在MySQL中創建資料庫lipstick並導入數據。

首先對於店名為空的數據可以刪除,另外查詢出不存在描述分、價格分、質量分、服務分為空值的數據。同時,評論數和銷售量為空的數據更新為0。

select * from lipstick where `name` = ;
DELETE from lipstick where `name` = ;
UPDATE lipstick set num_evaluate = 0 where num_evaluate = ;
UPDATE lipstick set num_sold = 0 where num_sold = ;

其餘數據還存在空值,為保護數據的真實性不再做修改。

三、MySQL分析

1.銷售量前10%的口紅在評分、功效上有什麼特點?

  • 評分

數據量共1657條,我們選取銷售量前165條數據,並統計其各項評分的最高分和平均分。另外選取所有數據各項評分的最高分、最低分、平均分作為參考對比。代碼如下:

SELECT round(MAX(score_dis),2), round(AVG(score_dis),2),
round(MAX(score_price),2), round(AVG(score_price),2),
round(MAX(score_quality),2), round(AVG(score_quality),2),
round(MAX(score_service),2), round(AVG(score_service),2) FROM
(SELECT * FROM lipstick ORDER BY num_sold DESC LIMIT 165) a;

SELECT ROUND(MAX(score_dis),2), ROUND(MAX(score_price),2),
ROUND(MAX(score_quality),2), ROUND(MAX(score_service),2)
FROM lipstick;

SELECT ROUND(MIN(score_dis),2), ROUND(MIN(score_price),2),
ROUND(MIN(score_quality),2), ROUND(MIN(score_service),2)
FROM lipstick;

SELECT ROUND(AVG(score_dis),2), ROUND(AVG(score_price),2),
ROUND(AVG(score_quality),2), ROUND(AVG(score_service),2)
FROM lipstick;

對於評分結果分析如下 :

銷售量前10%的口紅各項評分平均為4.5左右,除服務分最高分為4.8外,其餘各項評分最高分均為4.7。

從所有數據中得到的各項評分最高分除服務分為4.85外,其餘各項評分最高為4.7。最低評分都沒有低於4分,平均分值比銷量前10%的平均分值要高。

根據以上數據分析,各項評分最高分者有進入前10%,服務分最高的口紅銷量卻沒有進入前10%,總體平均評分高於銷量前10%的口紅平均評分,可以看出銷量高評分都很高,不過評分並沒有絕對的影響銷量情況,說明消費者對口紅的選擇上還有別的關注點。

  • 功效

數據量共1657條,我們選取銷售量前165條數據,大致選取幾個口紅功效描述詞,統計其中出現頻次。代碼如下:

SELECT skin, effect, sunscreen, crowd FROM
(SELECT * FROM lipstick ORDER BY num_sold DESC LIMIT 165) a;

SELECT
COUNT(CASE WHEN effect LIKE %易上色% THEN 1 END) as 易上色,
COUNT(CASE WHEN effect LIKE %防脫妝% THEN 1 END) as 防脫妝,
COUNT(CASE WHEN effect LIKE %遮瑕% THEN 1 END) as 遮瑕,
COUNT(CASE WHEN effect LIKE %保濕% THEN 1 END) as 保濕,
COUNT(CASE WHEN effect LIKE %滋潤% THEN 1 END) as 滋潤,
COUNT(CASE WHEN effect LIKE %補水% THEN 1 END) as 補水,
COUNT(CASE WHEN effect LIKE %不掉色% THEN 1 END) as 不掉色,
COUNT(CASE WHEN effect LIKE %持久% THEN 1 END) as 持久,
COUNT(CASE WHEN sunscreen LIKE %是% THEN 1 END) as 防曬
FROM
(SELECT * FROM lipstick ORDER BY num_sold DESC LIMIT 165) a;

SELECT crowd, COUNT(crowd) FROM (SELECT * FROM lipstick ORDER BY num_sold DESC LIMIT 165) a
GROUP BY crowd;

對於功效結果分析如下:

對於銷量前10%的口紅來說,其中集中描述詞和出現頻率如下圖:

如果我們認為防脫妝=不掉色=持久,保濕=滋潤=補水,那麼重新進行整理得到:易上色 65 39.39%;防脫妝 13 7.88%;保濕 60 36.36%;遮瑕 1 0.61%;防曬 9 5.45%。其中數字代表絕對量,百分數表示在銷售前10%中的比例。

可以看出口紅功效需求上,對於易上色和保濕的需求比較多,對於防曬、遮瑕、防脫妝的需求沒有特別多。

畢竟,對於口紅來說,防曬不是最重要的功能;而遮瑕也有遮瑕棒等更專業的化妝品替代;口紅本來就是比較容易脫妝的,畢竟喫東西是難免不脫妝的,大部分人會選擇隨時補妝,所以沒有強求不脫妝。

但是顯色是對於口紅的基本要求,所以易上色的需求較高,另外對於皮膚的保護也是人們選擇化妝品時必然會考慮的。

最後一個是關於適用人羣的統計,其中大部分是沒有特別說明,除此之外是通用和女用,男士專用的只有一個。

2.售價對銷售量的影響如何?

這裡查詢了售價的最高值和最低值,以確認一個價格的區間。同時通過大致瀏覽價格水平,可以確定製作直方圖的區間長度。代碼如下:

SELECT price, num_sold FROM lipstick;

SELECT max(price), min(price) FROM lipstick;

SELECT count(CASE WHEN price <= 20 THEN 1 END) as a1,
count(CASE WHEN price <= 40 and price > 20 THEN 1 END) as a2,
count(CASE WHEN price <= 60 and price > 40 THEN 1 END) as a3,
count(CASE WHEN price <= 80 and price > 60 THEN 1 END) as a4,
count(CASE WHEN price <= 100 and price > 80 THEN 1 END) as a5,
count(CASE WHEN price > 100 THEN 1 END) as a6
FROM lipstick;

對於售價和銷量的關係,我們可以看到40到60的價格水平銷量最多,其次是60-80的水平,較少的是80到100的價格水平。這些口紅的主要屬於平價口紅,可以看出口紅的價格在60以下為一個階段,在60-80為一個階段,當口紅價格超過80時,消費者很可能會選擇100以上質量更好一點的口紅。

有了這個猜測,我們選取100元以上的口紅再進行細分討論。代碼如下:

SELECT price FROM lipstick WHERE price > 100;

SELECT count(CASE WHEN price <=200 THEN 1 END) as b1,
count(CASE WHEN price <=300 AND price >200 THEN 1 END) as b2,
count(CASE WHEN price <=400 AND price >300 THEN 1 END) as b3,
count(CASE WHEN price <=500 AND price >400 THEN 1 END) as b4,
count(CASE WHEN price >600 THEN 1 END) as b5
FROM
(SELECT price FROM lipstick WHERE price > 100) b;

從上圖中可以看出,100-300元的口紅銷量在100元以上的口紅銷量中比較多,而大於300元的口紅銷量驟減,很可能是因為大於300元的口紅已經接近於專櫃價格,人們更傾向於直接去專櫃試色購買而非網上購買。

3.對於國內外口紅的需求情況有什麼偏好?

我們考慮對哪些國家的口紅需求較多,這些國家的口紅都是在什麼價位的。

SELECT nation, count(nation) as c FROM lipstick GROUP BY nation ORDER BY c DESC;

SELECT nation, price, rank() over(PARTITION BY nation ORDER BY price DESC)
from lipstick WHERE nation in (韓國,法國,泰國);

SELECT nation, ROUND(AVG(price),2) FROM lipstick WHERE nation in (韓國,法國,泰國) GROUP BY nation;

其中,除了國內銷量最高以外,對於國外的口紅銷量最高的前三名為法國,韓國和泰國。

法國的口紅最貴的是625.98,最便宜的是22.5元;韓國口紅最貴的是999有4條記錄,最便宜的是9.9;泰國口紅最貴的是240,最便宜的是24.5元。平均來看,法國口紅均價為237.06元,韓國均價為66.12元,泰國均價為40.96元。

這裡我們看到法國口紅的均價普遍較貴,韓國的最高價口紅999元的銷量也有4個,那麼我們猜測,是否國外的口紅普遍較貴,這裡我們選取了價格排名前10%的口紅,按國家匯總,代碼如下:

SELECT nation, count(nation) FROM
(SELECT price, nation FROM lipstick ORDER BY price DESC LIMIT 165) a
GROUP BY nation ORDER BY count(nation) DESC;

結果中可以看到,在價格最貴的前10%的口紅中,法國、韓國、日本的數量排名前三,法國是著名的奢侈化妝品大國,韓國和日本的化妝品也早已享有盛譽,所以高價位的口紅消費者都會傾向於選擇這三個國家而非中國本土的口紅。

四、結論

通過探究以上三個問題,我們可以得出以下結論:

1.銷量靠前的口紅在評分上也是高的,但是評分並沒有完全決定了銷量水平,大部分消費者更在意的口紅功效為易上色和保濕。目前口紅的受眾還是以女性或者男女通用為主,專門的男士口紅還是很少,幾乎沒有。

2.40到80元口紅的銷量較高,而超過100元的口紅中消費者更青睞300以下的口紅,因為300以上的口紅完全可以通過專櫃購買更方便。

3.對於國外口紅的偏好上,消費者更青睞法國、韓國和泰國的口紅,其中法國、韓國、日本的口紅價格普遍偏貴。法國是奢侈化妝品大國,韓國和日本的化妝品也享有盛譽。泰國的化妝品價格更為平價。

五、建議

對於如果想提高口紅銷量,口紅產品需要注意:

1.在產品價格上,消費者普遍喜歡平價口紅。100到300元的口紅是提高一個價位階層的首選項。

2.在功能上必備的功能是易上色和保濕,同時,防脫妝可以作為加分項。

3.在進口方面,高價位的口紅可以選擇法國,平價的可以選擇泰國,如果想提高一點價格,可以選擇韓國和日本的口紅。


推薦閱讀:
相關文章