酷狗音樂的「猜你喜歡」——音樂推薦系統,背後是基於什麼數學模型?
咱們可以推測下這個數學模型。
模型要解決的問題是:通過收集用戶過往所聽音樂歷史數據,分析並給出用戶很可能喜歡的音樂,推薦給用戶。這個數學模型的建立,是統計數據分析。
以上這個過程可以分裂為幾個環節:
第一,收集用戶聽音樂歷史數據,並建立資料庫。
第二,對個體資料庫進行特性歸類處理,進而給每個用戶貼「標籤」。換言之,就是通過對個體用戶的數據進行分析,通過數據特性,給每個用戶貼上標籤,標籤適當的多,以便對用戶精確歸類。例如,某用戶過往聽歌多為戲曲,則可給該用戶貼上戲曲標籤。
第三,對音樂和歌曲進行特性歸類處理。歸類的類別標籤要和用戶標籤一致。
第四,音樂推薦環節:將貼有相同歸類標籤的用戶與音樂聯通,則該用戶便可得到他愛聽的音樂類型的大集合。
以上大概是該數學模型的原理。它的本質和悟空問答邀不同的人回答不同的問題,做歸類處理的道理,相差無幾。
推薦閱讀: