論文:Graph Convolutional Neural Networks for Web-Scale Recommender Systems
作者:Rex Ying??, Ruining He來源:KDD, 2018
0.概括
本文的理論基礎為上一篇文章:GraphSAGE: GCN落地必讀論文
斯坦福和Pinterest公司合作提出了第一個工業級別(數十億節點和數百億邊)基於GCN的推薦系統,並在離線評估和AB實驗選中取得了不錯的效果。
斯坦福圖這塊非常厲害,Node2Vec和GraphSage都是出自這裡,論文中GCN落地的技巧和創新非常值得借鑒。
1.問題設定
用戶在Pinterest中 自己感興趣的東西用圖釘(pin)釘在釘板(broad),包擴10億pin ,10億board 以及180億邊(若pin在broad中,則它們之間存在一條邊)。
目標是利用pin-broard二分圖結構和屬性(如描述文本、圖片特徵),生成pin的高質量的embedding用於推薦任務,如相關pin推薦,或者作為機器學習系統的輸入特徵。
2. PinSage框架
本章節描述PinSage 框架和訓練細節,以及基於訓練好的模型使用MapReduce高效生成每個節點的embedding。
2.1 局部圖卷積
局部圖卷積是本文的核心,通過對節點鄰域子圖進行多個卷積操作,以此聚合鄰居特徵的方式生成節點embedding。
每個卷積模塊都學習如何聚合來自子圖的信息,並堆疊起來,可以獲得局部網路拓撲信息。並且卷積模塊的參數在所有節點之間共享,大大減少複雜度,不受輸入圖尺寸的影響。
2.2 模型框架
本章介紹圖卷積的前向傳播演算法:利用節點u的特徵和其周圍的圖結構,生產節點的embedding
2.2.1 卷積層
學習如何將u周圍鄰居信息聚合: