基于特征学习的广告点击率预估技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:xymztttt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算广告学中的点击率预估问题一直受到学术界和工业界的高度关注,它在信息检索、机器学习、查询推荐等领域一直是研究的热点。搜索广告点击率预估旨在通过给定的<查询,广告>信息、上下文环境信息等,预估用户点击广告的概率。目前,该问题的研究方向主要包括:一,统计学习模型。其关键是设计特征提取方案,如抽取同一页面广告之间的相关性特征、构造组合特征等方式,尽可能获取与广告点击率高度关联的特征融入点击模型,从而提高模型预估的准确率。二,基于概率图模型对用户行为建模。通过假设检验,借助贝叶斯网刻画用户浏览场景,进而推断出在一个查询会话中点击序列的概率。人工构造特征,存在效率低、可扩展性差和性能提升困难等问题;而贝叶斯网刻画用户浏览行为,信息利用不充分,并且没有考虑到广告数据具有高度稀疏性、特征之间存在高度非线性关联的本质特点。本文根据以上问题并结合广告数据的特点,从特征学习的角度提出了面向广告数据的稀疏特征学习方法,该方法充分利用了特征降维和特征学习的优点。首先,根据相同类型对象内部之间相关性的特点,采用聚类降维,使得数据具有初始聚合性;然后根据不同类型对象之间存在关联,采用张量降维,运用张量分解法在保护广告点击数据原有结构关联的同时,降低特征维度。其次,研究并利用深度学习模型SAEN算法,挖掘广告数据特征间的组合关系,获得广告数据新的表示特征,新特征对数据有着更强的表达能力,有利于提高点击预估的精度。再次,用学到的新特征作为点击预估模型的特征输入,L-BFGS算法训练逻辑回归模型。最后,在实验部分,本文通过与已有方法进行比较,验证预估效果。实验结果表明,本文提出的面向广告数据的稀疏特征学习方法能够有效的提升广告点击率的预估精度。
其他文献
<正>~~
会议
我国现代拍卖行业从1986恢复试点至今已有约30年的历史,行业自恢复以来一直稳步前进,各地拍卖企业在我国政策法规和当地政府的支持下迅速成长,拍卖行业已成为我国商品流通领
伴随着改革开放30年来的快速发展,烟草企业为国家财政增收、烟农脱贫致富、卷烟零售客户就业增收以及慈善捐赠、抗震救灾、教育支持、节能环保等各个方面做出了积极贡献。随
自20世纪60年代以来,自由贸易区进入了蓬勃发展时期,尤其是新兴国家和地区及发展中国家,把创建自贸区作为发展国际贸易、扩大投资、增加就业、促进区域经济发展的重要手段。
随着中欧贸易关系的逐步增进,出现了越来越多的贸易摩擦,中国已经连续十七年成为被反倾销诉讼最多的国家。我国的出口企业因为内外部双重因素导致不能有效地处理欧盟反倾销案
目的通过检测IGF-1在大鼠骨骼肌缺血再灌注损伤模型中的表达及观察局部愈合情况了解超短波治疗对骨骼肌缺血再灌注损伤愈合的作用。方法取健康成年SD大鼠24只,体重大致相等。
90年代以来,我国的动漫行业一直处于低迷的状态,在日本和美国动漫发展得风生水起,逐步打开中国市场的时候,国产动漫还处于“低幼化“的状态。一直到玄机科技的出现,才开始打
在市场经济条件下,金融机构同一般企业一样,必须遵从优胜劣汰的竞争法则,破产倒闭不可避免。但是同一般企业相比,金融机构破产在破产原因、破产程序启动、破产重整程序、破产
在全球化发展背景下,中国作为发展中的第一大国,东盟国家作为亚洲地区最具影响力的区域型经济组织,双方都有构建自由贸易区的意愿,并逐步落实。2002年《中国——东盟自由贸易
近年来,零售市场集中化程度显著上升,形成了一批具有一定规模和影响力的零售组织。大型零售组织一方面能够带来各具特色的产品、恰如其分的服务;另一方面也能增加其对于供应