台湾 || 语言: 大陆简体港澳繁體台灣正體

推薦系統中的矩陣分解技術2009

雪花臺灣 2019-07-23 22:54

Matrix factorization techniques for recommender systems^[1]

協同過濾主要包含兩種方法，一種是近鄰法（neighborhood methods），另外一種是隱因子模型（latent factor models）。近鄰法又可分為item-based和user-based，隱因子模型裏最成功的一種實現是矩陣分解（matrix factorization.）。本文主要對矩陣分解技術進行介紹。

一種基本的矩陣分解模型

矩陣分解模型將用戶和物品都映射到一個維的空間中去(可以認為是f個領域，例如懸疑，驚悚等等)，假設第i個物品用 $q_iin mathbb{R}^f$ 表示，第u個用戶用 $p_uin mathbb{R}^f$ 表示，中的元素表示物品i在相應領域的歸屬程度，中的元素表示用戶u對相應領域的感興趣程度。只要計算出和，那麼用戶u對物品i的興趣可以用式（1）來預測

$hat{r}_{ui}=q_i^Tp_u,(1)$

奇異值分解通常可以完成上述任務，例如在信息檢索裏，但是用戶-物品矩陣是高度稀疏且不完整的。當矩陣不完整時，傳統的奇異值分解是不確定的，且高度稀疏極容易造成過擬合。因此，換一種方式最優化的方式來求解

圖1. 幾種演算法的實驗結果

r_{ui} — 圖1. 幾種演算法的實驗結果

相關文章