台湾 || 语言: 大陆简体港澳繁體台灣正體

前深度學習時代CTR預估模型的演化之路

雪花台灣 2019-04-17 08:56

這裡是「王喆的機器學習筆記」的第十一篇文章，有一段時間沒有更新文章了，因為受InfoQ的約稿，梳理了一下子從傳統機器學習

時代到深度學習時代所有經典CTR模型的演化關係和模型特點。我們這篇文章先從前深度學習時代開始，幫大家梳理傳統CTR模型的知識體系。

在互聯網永不停歇的增長需求的驅動下，CTR預估模型（以下簡稱CTR模型）的發展也可謂一日千里，從2010年之前千篇一律的邏輯回歸（Logistic Regression，LR），進化到因子分解機（Factorization Machine，FM）、梯度提升樹（Gradient Boosting Decision Tree，GBDT），再到2015年之後深度學習的百花齊放，各種模型架構層出不窮。

我想所有從業者談起深度學習CTR預估模型都有一種莫名的興奮，但在這之前，認真的回顧前深度學習時代的CTR模型仍是非常必要的。原因有兩點：

即使是深度學習空前流行的今天，LR、FM等傳統CTR模型仍然憑藉其可解釋性強、輕量級的訓練部署要求、便於在線學習等不可替代的優勢，擁有大量適用的應用場景。模型的應用不分新舊貴賤，熟悉每種模型的優缺點，能夠靈活運用和改進不同的演算法模型是演算法工程師的基本要求。
傳統CTR模型是深度學習CTR模型的基礎。深度神經網路（Deep Nerual Network，DNN）從一個神經元生髮而來，而LR正是單一神經元的經典結構；此外，影響力很大的FNN，DeepFM，NFM等深度學習模型更是與傳統的FM模型有著千絲萬縷的聯繫；更不要說各種梯度下降方法的一脈相承。所以說傳統CTR模型是深度學習模型的地基和入口。

下面，我們用傳統CTR模型演化的關係圖來正式開始技術部分的內容。

傳統CTR模型的演化關係圖

傳統CTR模型的演化關係圖

相关文章