分类: 广告&推荐

广告&推荐面面观(2):大规模分片线性模型MLR

一、动机点击率预估需要解决的超高维度离散特征空间模式识别的问题,它需要算法在做到可以有效发现当前数据规律的同时,还要具有足够的泛化能力去应对线上多变的user-context-content模式,所以到目前为止有许多的CTR模型被应用于实际场景中,诸如LR、DNN、Tree Model、FM/FFM,这些模型都有各自的优势,但也存在缺陷,整理如下: 阿里妈妈在2011年提出了MLR模型,全称L

广告&推荐面面观(1):经久不衰的逻辑回归

推荐和广告已成为互联网公司的标配,这两者之间有相通的地方,推荐系统被广泛的应用于计算广告中,是其不可或缺的模块,当然推荐系统可以有更多其他的场景,比如淘宝京东的商品推荐、APP Store的应用推荐,今日头条的内容推荐等等,它需要兼顾媒体和用户这样个参与者;而广告作为互联网公司的核心业务模块,需要有推荐系统的支持,它将来自广告主的广告更有效的推荐给在媒体端观看的用户,串联的是广告主、媒体、用户三个参与方,必须要这三方玩的开心。广告的永恒目标是直接或者间接地帮助公司盈利,偏重商业,而推荐更多的是改善用户体验,提高留存,偏重产品。 这个系列,我们会从经典的点击率预估算法开始,包括LR、MLR、GBDT+LR、FM/FFM、DeepFM、Wide&Deep、DIN、DIEN、PNN、NFM、AFM、DCN等等,层出不穷的算法模型正是为了因具体的业务场景而生,即使是很微小的提升,也会对公司的收益有很大的贡献。再之后深入到计算广告和推荐系统身后更为广义的业务相关的知识、系统的架构等等。这一系列的文章会邀请业界的前辈来撰写或者转载优质的总结,争取有一个完整的展示。 第一篇,我们先从逻辑回归模型开始。 虽然目前已经有很多深度学习模型可以在不同场景下获得不错的预测广告点击率,但仍然有很多公司的广告算法部门在使用逻辑回归模型,那为何在深度时代背景下传统的逻辑回归模型在点击率预估中仍然有其用武之地呢?可以归纳为以下几点: