本文主要介紹兩篇CTR預估的文章,分別是發表在KDD 2018上的Deep Interest Network for Click-Through Rate Prediction以及該方法的進化版本Deep Interest Evolution Network for Click-Through Rate Prediction。
CTR預估是在線廣告以及電商的非常重要的業務,除了傳統的方法之外,目前以embedding和MLP為主的深度學習方法也廣為應用。在這些方法中,用戶特徵用固定長度的向量來表示,而已有的方法往往忽視獲取用戶歷史行為中的興趣多樣性,即在電商網站的廣告展示中,用戶可能會同時對不同的廣告有興趣。一種暴力的對用戶興趣多樣性建模的方法是讓特徵向量足夠的大,當然這會帶來計算和存儲上的困難,並且在線系統也不會允許這種方法。除此之外,當為某個廣告進行預測時,並不是歷史行為中的所有用於興趣都是有用的,用戶買書的時候是不會考慮已經買過的衣服的。很自然的,attention可以很好的解決以上問題,論文作者提出的Deep Interest Network從歷史行為中學習user interest,其核心思想就是attention。除了DIN網路之外,作者還提出了mini-batch的正則化以及PReLU的更泛化的方法,Dice。下面首先介紹Base model,如下圖所示