基于循环神经网络的广告点击率预估研究

来源 :浙江理工大学 | 被引量 : 4次 | 上传用户:wenshibing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网广告十余年持续爆炸式的发展,计算广告学也随之应运而生。作为计算广告流量变现的最重要方式之一,广告点击率预估不论从搜索广告到程序化交易,还是移动互联网下的原生广告,都扮演着关键的角色。广告点击率预估主要是基于海量用户历史数据,在复杂的定向规则下,借助大数据技术和机器学习模型,对候选广告进行排序预测,使得在特定的场景下,将合适的广告展示给合适的受众用户。如何解决线性模型学习能力有限、充分挖掘广告特征之间非线性关系的问题,一直是相关领域研究的重点。在充分调研各种广告点击率预估问题常用的机器学习模型的前提下,提出采用一种基于门控循环单元神经网络(the Gated Recurrent Unit Neural Networks,GRU)模型应用于广告点击率预估的问题上。进一步,通过优化改进门控循环单元神经网络的步长控制方法,使得模型在更少的迭代轮次下,更好更快地到达最优点,从而提高模型的预估能力。本文的主要工作和取得的成果具体如下:(1)针对浅层和深层模型作特征工程,包括实验数据的分析、预处理、特征选择和特征设计等。采用一种改进的循环神经网络—门控循环单元神经网络,将一般循环神经网络的隐藏层替换成门单元结构,利用门单元特殊的门控机制来控制梯度传播,从而提升广告数据特征的学习能力。(2)在门控循环单元神经网络的基础上,设计了一种优化步长控制方法。先设置一个较大的步长快速寻找全局近似最优点,再利用较小的步长通过指数迭代衰减找到局部最优,在迭代速度和准确性上提升模型的预估效果。最终得到的AUC值比基于循环神经网络模型高出0.053932,比基于未做步长优化的模型高出0.003855。(3)本文比较了逻辑斯特回归、朴素贝叶斯、随机森林、循环神经网络、门控循环单元神经网络及其步长优化版6种模型的效果,实验结果表明,基于门控循环单元神经网络及其步长优化的模型在广告点击率预估上的效果最好。
其他文献
国民党政府在战后结束中日战争状态,实施对日处置的整个过程中都受到当时美国亚洲政策的影响.政策制定遵循美国意志;具体实施随美国亚洲政策的转变而逐渐由减缓到停止;最后在
目的探讨氨磷汀在骨肉瘤大剂量多药联合化疗中使用对血液学毒性的影响。方法 42例骨肉瘤患者随机分为化疗加氨磷汀组(观察组)及单纯化疗组(对照组),各21例。行MTX-MTX-DDP-AD
随着全世界化石燃料能源——煤和石油等的消耗量日益增加,燃烧过程中排放的硫的氧化物和氮的氧化物越来越多,导致这些气态化合物在大气中反应生成硫酸和硝酸,这些酸性物质随
严歌苓,在二十多年的文字生涯中,以自己的多部长篇、中短篇小说,以及电影剧本、人物传记等,成为了颇有代表性的旅美华裔女作家。她的多部作品都在海内外华文文学研究界引起了
人性论是霍布斯政治哲学的基础,激情理论则构成了霍布斯人性理论的核心。对霍布斯的激情理论做专题研究,是我们更深刻、更全面地把握霍布斯人性论及其政治哲学的基础。 霍布
SC-CO2已逐渐应用到微胶囊化技术中。本文采用超临界反应包覆法制备囊芯为红磷、囊壁为间位芳香族聚酰胺的膨胀型微胶囊阻燃剂,并通过SEM、TG-DTA、元素分析、CONE等分析测试
[目的]探索新形势下免疫预防接种工作模式。[方法]制定标准,明确目标,健全制度,强化培训,加强督导,严格考核。[结果]提高了接种率和接种质量,针对传染病得到有效控制,改善了
九十年代以来,我国社会在政治、经济、文化等方面都呈现出新的变化。这些变化同时也推动了语言的发展,新词新语大量涌现,其中有一些新词语是通过赋予旧词以新义而产生的。本文讨
<正> 最近以来教师教育成了教育界的热门话题。的确,教师是办好教育的关键。列宁曾经说过:“学校的真正的性质和方向并不由地方组织的良好愿望决定,不由学生‘委员会’的决议
为了保护人类的健康,保护环境以及控制自然资源的使用,我国政府在环境保护验收工作中进行了环境监测。在环境保护验收工作中,环境监测的作用是采集环境数据,将采集的数据积累