论文部分内容阅读
互联网技术的高速发展引领互联网广告进入了新纪元,互联网广告以其广泛的受众和效果可追踪的优点,迅速成为当今最主要的广告形式。在互联网广告中,网站作为广告的载体,多采取“按点击付费”的方式与广告主进行结算。在这种模式下,如何在有限的广告位中收获更多的点击,提高自身收益,是网站必须要考虑的问题。点击率预估指的是预测给定用户点击给定广告的概率,从理论上来讲,只要能够准确地预估用户点击广告的概率,将概率较大的广告放置在较靠前的广告位上,就可以吸引用户产生点击,从而提高网站收入。因此,准确的点击率预估算法不但可以提高网站收入,而且能够保障广告主的广告效果,提升用户体验,对实现三方利益的共赢有着十分重要的意义。一直以来,点击率预估在学术界和工业界都是一个热点话题,通常会使用统计与机器学习的方法加以解决。本文将基于逻辑斯特回归的点击率预估算法作为基线算法,针对基线算法在展示广告和搜索广告中遇到的问题,分别设计并实现了优化算法。在展示广告中,为了降低人工特征工程的时间和人力成本,提高模型预测的准确率,本文设计并实现了一种基于GBDT和因式分解机的点击率预估算法,实现了特征工程自动化和数据中非线性关系的拟合。在搜索广告中,检索词与广告标题在文本层面的相似度并不能完全反映用户的检索意图。为了理解用户的检索需求,本文设计并实现了一种基于注意力模型的点击率预估算法,通过挖掘检索词和广告标题在“检索意图”层面的相似度,提高预估的准确率。实验结果表明,本文设计并实现的点击率预估算法优于基线算法,符合预期,较好地完成了点击率预估算法的研究。