【新】Facebook的深度學習推薦系統

分享一下Facebook新發的深度學習

推薦系統的論文Deep Learning Recommendation Model for Personalization and Recommendation Systems.

這篇文章概述了當前推薦系統實現的主要思路，提出了一種通用的模型結構DLRM，與其他常見的paper不同，該篇有著濃濃的工業界風格，不僅和其他模型進行效果對比，還講述了常見的特徵如何處理，內在思維邏輯如何，在大規模的現實場景中會面臨哪些問題。像大規模稀疏特徵如何解決，比如用數據並行與模型並行相結合。以及CPU和GPU在實踐中的性能如何，等等。

有在真實線上實踐的同學應該都有過各自的思考，其實我覺得這裡邊的思路相關同學都是瞭解的，模型結構也不是壁壘，許多推薦系統問題在實踐中更偏向於工程問題。像現今的開源框架都無法支持大規模推薦系統，所以各家其實都有自研的框架和配套設施，去解決海量用戶&產品等對應的embeddings，合適的online training等等問題。

博客裏latex公式顯示的更好些

Deep Learning Recommendation Model for Personalization and Recommendation Systems?

wd1900.github.io

另外發個廣告，位元組跳動抖音火山技術團隊開啟2020屆校招提前批，失敗也不影響正常秋招流程，需要內推可發我郵箱[email protected] or [email protected],社招同學也歡迎，演算法，大數據，服務端等都需要

簡介

目前個性化推薦有兩個主要的方向，現在基本都投奔了深度學習的懷抱中。

the view of recommendation systems

早期系統僱傭專家們來對產品進行分類，用戶選擇他們喜好的類別並基於他們的偏好進行匹配。此領域後來演變成了協同過濾，推薦基於用戶過去的行為，比如對產品的打分。Neighborhood methods將用戶和產品分組並用矩陣分解來描述用戶和產品的latent factors，獲得了成功。

the view of predictive analytics

用統計學模型去分類或預測給定數據的事件概率。預測模型從原來的用簡單的linear and logistic regression建模轉向了用deep networks。為了處理類別特徵，一般採用embeddings，將one-hot或multi-hot vectors轉換到抽象空間的dense respresentations。這裡的抽象空間其實也就是推薦系統中的latent factors空間。

本文結合了上邊的兩種角度，模型使用embeddings處理稀疏特徵，MLP處理稠密特徵，然後用統計技術進行顯示的特徵交叉。最後用另一個MLP來處理交差後的特徵，得到事件的概率。我們將這個模型稱為RLRM，見圖1。Pytorch&Caffe2開源實現地址