【新】Facebook的深度学习推荐系统

分享一下Facebook新发的深度学习

推荐系统的论文Deep Learning Recommendation Model for Personalization and Recommendation Systems.

这篇文章概述了当前推荐系统实现的主要思路，提出了一种通用的模型结构DLRM，与其他常见的paper不同，该篇有著浓浓的工业界风格，不仅和其他模型进行效果对比，还讲述了常见的特征如何处理，内在思维逻辑如何，在大规模的现实场景中会面临哪些问题。像大规模稀疏特征如何解决，比如用数据并行与模型并行相结合。以及CPU和GPU在实践中的性能如何，等等。

有在真实线上实践的同学应该都有过各自的思考，其实我觉得这里边的思路相关同学都是了解的，模型结构也不是壁垒，许多推荐系统问题在实践中更偏向于工程问题。像现今的开源框架都无法支持大规模推荐系统，所以各家其实都有自研的框架和配套设施，去解决海量用户&产品等对应的embeddings，合适的online training等等问题。

博客里latex公式显示的更好些

Deep Learning Recommendation Model for Personalization and Recommendation Systems?

wd1900.github.io

另外发个广告，位元组跳动抖音火山技术团队开启2020届校招提前批，失败也不影响正常秋招流程，需要内推可发我邮箱[email protected] or [email protected],社招同学也欢迎，演算法，大数据，服务端等都需要

简介

目前个性化推荐有两个主要的方向，现在基本都投奔了深度学习的怀抱中。

the view of recommendation systems

早期系统雇佣专家们来对产品进行分类，用户选择他们喜好的类别并基于他们的偏好进行匹配。此领域后来演变成了协同过滤，推荐基于用户过去的行为，比如对产品的打分。Neighborhood methods将用户和产品分组并用矩阵分解来描述用户和产品的latent factors，获得了成功。

the view of predictive analytics

用统计学模型去分类或预测给定数据的事件概率。预测模型从原来的用简单的linear and logistic regression建模转向了用deep networks。为了处理类别特征，一般采用embeddings，将one-hot或multi-hot vectors转换到抽象空间的dense respresentations。这里的抽象空间其实也就是推荐系统中的latent factors空间。

本文结合了上边的两种角度，模型使用embeddings处理稀疏特征，MLP处理稠密特征，然后用统计技术进行显示的特征交叉。最后用另一个MLP来处理交差后的特征，得到事件的概率。我们将这个模型称为RLRM，见图1。Pytorch&Caffe2开源实现地址