虽然目前已经有很多深度学习模型可以在不同场景下很好的预测广告点击率,但仍然有很多公司的广告演算法部门使用base的逻辑回归模型,那为什么在深度时代背景下传统的逻辑回归模型在点击率预估模型中仍然有其用武之地呢?可以归纳为以下几点:
1. 逻辑回归的解释性很强。当业务人员问你ecpm是如何预估出来的,你就可以对产品说,我们的模型是通过对这里的N多个有业务意义的特征进行加权求和(偏置项和正则项可无需交代),然后再经过一个Sigmoid函数,映射到一个0到1的区间,就预估得到了我们所需的点击率,产品一定会对你的工作表示赞同与认可(微笑脸);此外,当bad case出现的时候,就可以轻松解释是什么特征在作祟影响结果,而那些深度模型,八个字归纳就是:玄学调参+玄学解释。
2. 逻辑回归的训练并行方案比较成熟。广告点击率预测需要基于大规模的样本和特征来做的,一般是上亿级别,这个时候就需要用多台机器来分散式计算参数更新;此外在线更新的时候,如果是其他模型,需要动用所有的特征,而逻辑回归得益于其线性模型的优势,可以只更新那些有变动的特征,其余不变的特征缓存起来即可,这样就大大减少了存储压力和计算代价。
3. 逻辑回归的简单易用使得很多公司并不会花太多的精力去升级需要耗费大量精力和计算代价的深度模型,而且在数据量极大的时候,逻辑回归与其他深度模型的预测差异并不见得那么大,所以,何苦要把自己往费时费精力费钱的处境推呢;要知道,高性能机器并不是每个公司都可以承受的。演算法工程师就可以把更多的时间用于特征工程,当然这两者也是一个trade-off;