選自Facebook博客,作者:Maxim Naumov等,機器之心編譯,參與:路、一鳴。
近日,Facebook 開源了深度學習推薦模型 DLRM。DLRM 通過結合協同過濾演算法和預測分析方法,提供了推薦系統當前最優效果。
隨著深度學習的發展,基於神經網路的個性化和推薦模型成為在生產環境中構建推薦系統的重要工具。但是,這些模型與其他深度學習模型有顯著區別,它們必須能夠處理類別數據(categorical data),該數據類型用於描述高級屬性。對於神經網路而言,高效處理這種稀疏數據很有難度,缺乏公開可用的代表性模型和數據集也拖慢了社區在這方面的研究進展。
為了促進該子領域的進步,Facebook 開源了當前最優的深度學習推薦模型 DLRM,該模型使用 PyTorch 和 Caffe2 平台實現。DLRM 通過結合協同過濾演算法和預測分析方法,相比其他模型獲得進一步的提升,從而能夠高效處理生產級別數據,並提供當前最優結果。
Facebook 在官方博客中表示:開源 DLRM 模型以及公布相關論文,旨在幫助社區尋找新的方式,解決這類模型面臨的獨特挑戰。Facebook 希望鼓勵進一步的演算法實驗、建模、系統協同設計和基準測試。這將有助於新模型和更高效系統的誕生,從而為人們使用大量數字服務提供更具相關性的內容。
- DLRM 開源地址:https://github.com/facebookresearch/dlrm
- DLRM 論文:https://arxiv.org/abs/1906.00091
了解 DLRM 模型
DLRM 模型使用嵌入處理類別特徵,使用下方的多層感知機(MLP)處理連續特徵。然後顯式地計算不同特徵的二階相互作用(second-order interaction)。最後,使用頂部的多層感知機處理結果,並輸入 sigmoid 函數中,得出點擊的概率。