Matrix factorization techniques for recommender systems[1]
協同過濾主要包含兩種方法,一種是近鄰法(neighborhood methods),另外一種是隱因子模型(latent factor models)。近鄰法又可分為item-based和user-based,隱因子模型裏最成功的一種實現是矩陣分解(matrix factorization.)。本文主要對矩陣分解技術進行介紹。
一種基本的矩陣分解模型
矩陣分解模型將用戶和物品都映射到一個 維的空間中去(可以認為是f個領域,例如懸疑,驚悚等等),假設第i個物品用 表示,第u個用戶用 表示, 中的元素表示物品i在相應領域的歸屬程度, 中的元素表示用戶u對相應領域的感興趣程度。只要計算出 和 ,那麼用戶u對物品i的興趣可以用式(1)來預測
奇異值分解通常可以完成上述任務,例如在信息檢索裏,但是用戶-物品矩陣是高度稀疏且不完整的。當矩陣不完整時,傳統的奇異值分解是不確定的,且高度稀疏極容易造成過擬合。因此,換一種方式最優化的方式來求解