ctr預估演算法對於序列特徵embedding可否做拼接，輸入MLP?與pooling相比，優劣在哪？

ctr預估演算法或者推薦系統中的排序演算法，目前的主流做法是embedding＋MLP，對於序列特徵，比如瀏覽或者點擊過的物品序列，除了採用pooling，比如求和，平均或者DIN的加權求和，可否對物品序列按照時間順序對embedding向量做拼接，作為MLP的輸入？
與pooling相比，優劣在哪？

說一個曾經看到的paper，原諒我忘了名字，之後記起來補上

具體做法是，把embedding向量拼接成矩陣，然後用TextCNN類似的方式做一維卷積，應該類似於題主說的拼接。

其實所謂的拼接，就是想辦法不用序列建模而直接採用橫向或者縱向的拼接。題主想要用MLP(橫向拼接)，其實看看NLP裡面對於序列的處理，通常不會這麼做，一個是隱藏層參數太多，另一個位置信息不明顯(沒有序列性)，因為MLP既然全連接，那相鄰就沒有體現出來。

採用TextCNN的做法，既有一定的序列性，模型也比較輕，思路供參考。

直接拼接不如pooling簡單易控。序列的好文章：

Personalized Top-N Sequential Recommendation via Convolutional Sequence Embedding wsdm2018

A Simple Convolutional Generative Network for Next Item Recommendation wsdm2019

Modeling the Past and Future Contexts for Session-based Recommendation

跑個題，為啥直接送MLP。一般MLP效果都不好啊，沒有考慮直接特徵交叉行為。也有一些文章指出來這個問題。FFM、XdeepFM 更好用吧。

Latent Cross: Making Use of Context in Recurrent Recommender Systems

按時間順序拼接送入mlp，不是不可以。和pool相比，優點是可以更好的考慮時間順序，缺點是序列比較長的話，mlp的參數會比較多，對數據量的要求比較高，否則很容易過擬合，而pool就好很多。

提供個思路。