台湾 || 语言: 大陆简体港澳繁體台灣正體

PinSage:第一個基於GCN的工業級推薦系統

雪花臺灣 2019-05-01 21:46

論文：Graph Convolutional Neural Networks for Web-Scale Recommender Systems
作者：Rex Ying??, Ruining He來源：KDD, 2018

0.概括

本文的理論基礎為上一篇文章：GraphSAGE: GCN落地必讀論文

斯坦福和Pinterest公司合作提出了第一個工業級別（數十億節點和數百億邊）基於GCN的推薦系統，並在離線評估和AB實驗選中取得了不錯的效果。

斯坦福圖這塊非常厲害，Node2Vec和GraphSage都是出自這裡，論文中GCN落地的技巧和創新非常值得借鑒。

1.問題設定

用戶在Pinterest中自己感興趣的東西用圖釘(pin)釘在釘板(broad)，包擴10億pin ，10億board 以及180億邊（若pin在broad中，則它們之間存在一條邊）。

目標是利用pin-broard二分圖結構和屬性（如描述文本、圖片特徵），生成pin的高質量的embedding用於推薦任務，如相關pin推薦，或者作為機器學習系統的輸入特徵。

2. PinSage框架

本章節描述PinSage 框架和訓練細節，以及基於訓練好的模型使用MapReduce高效生成每個節點的embedding。

2.1 局部圖卷積

局部圖卷積是本文的核心，通過對節點鄰域子圖進行多個卷積操作，以此聚合鄰居特徵的方式生成節點embedding。

每個卷積模塊都學習如何聚合來自子圖的信息，並堆疊起來，可以獲得局部網路拓撲信息。並且卷積模塊的參數在所有節點之間共享，大大減少複雜度，不受輸入圖尺寸的影響。

2.2 模型框架

本章介紹圖卷積的前向傳播演算法：利用節點u的特徵和其周圍的圖結構，生產節點的embedding

2.2.1 卷積層

學習如何將u周圍鄰居信息聚合：

Qq, Ww 是卷積層參數，對應weight/bias

z_u — Qq, Ww 是卷積層參數，對應weight/bias

相關文章