基于软决策树的实时竞价展示广告成交价格预测

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:X2000N
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实时竞价(Real-Time Bidding,RTB)是大数据时代新兴的具有影响力的展示广告购买机制,RTB系统基于对互联网用户产生的大量数据的分析,能够识别每个广告展现(Impression)目标受众的特征和兴趣,并自动投放最佳匹配的广告。RTB系统中最受关注的是与需求方平台(Demand-Side Platform,DSP)相关的研究工作,DSP代表了广告主的诉求,DSP竞价策略的优劣直接影响广告主获取优质流量的能力,进而影响广告营销所带来的转化。在DSP中,成交价格作为广告展现的成本,能够有效地指导竞价策略的制定和投放预算的分配。本文针对成交价格预测展开了相关的研究工作,提出了基于软决策树的成交价预测模型,解决了两方面的问题:(1)目前,关于成交价格预测的相关研究工作通常是假设成交价格服从某种参数化的函数分布形式。但在实际中,成交价格来自成百上千广告主对某次广告展现的竞价,并不简单服从于某种假定的函数分布形式。而决策树模型可以避免这个问题,决策树提供了从输入到输出的自学习过程,无需函数假设;(2)普通决策树的构建过程忽视了维度间可能存在的相关性,而软决策树不同于普通决策树,软决策树在结点分裂时能根据不同概率影响左右子结点,利用这种特性能够建模维度间的相关性。此外,由于RTB过程采用第二竞价机制,DSP只有竞价成功才能观测到成交价格,竞价失败只能知道自身的出价,因此在成交价格预测中会面临数据缺失的问题。本文结合生存分析对软决策树模型提出了改进,采用K-M乘积限方法无偏估计竞价成功概率,并使用逆概率加权方法修正成交价格的真实误差,使竞价成功和竞价失败的数据记录能够同时反馈到软决策树模型的学习中,减少了实际应用中成交价格数据缺失问题带来的模型偏差。本文基于真实展示广告数据集iPinYou设计实验并进行实验验证,实验分别对比了基于假设分布和基于普通决策树的成交价格预测模型。实验结果表明,对比其他模型,本文提出的模型在预测误差上表现更佳,同时验证了考虑缺失数据的有效性和必要性。最后在树模型规模的比较上,本文提出的模型具有更小的树模型复杂度。
其他文献
本文根据弦支穹顶结构节点处汇交杆件的类型,对弦支穹顶结构的节点进行了分类。在分类的基础上,根据每类节点的受力特点和作者的实际工程经验,给出了相应的设计原则,并总结了
大岩桐,别名六雪尼,为苦苣苔科苦苣苔属多年生球根花卉.花顶生或腋生,呈钟形,花瓣表面呈丝茸状,有青、紫、墨红、玫红、洋红、大红、白、白边红心、白边蓝心等色,花朵大而鲜
农村供水是重要的农村水利基础设施,是我国新时期实施的新农村建设和乡村振兴战略的关键环节和重要基础,是城乡基本公共服务均等化的主要内容。经过多年的发展农村供水条件得
针对语言评价的群决策问题,定义了二元语言术语的概念及其运算法则,并给出二元语言和算子与二元语言加权平均算子,提出一种属性权重已知的语言评价群决策方法.方法首先利用二
目的:调查南宁市县级医院医生自杀意念发生率,了解医生职业压力和领悟社会支持现状,并分析医生自杀意念与职业压力、领悟社会支持等影响因素的关系。方法:用自杀意念问卷、工
<正>(一)双汇发展继斥巨资收购美国猪肉食品生产商史密斯菲尔德之后,双汇被曝对西班牙肉类食品加工商Campofrio发起竞购要约。业内分析,如收购成功,双汇在美、欧布局将基本实
目的分析研究C-erbB-2、ER、PR在乳腺癌中的表达与转移及预后关系.方法用免疫组化法测定93例原发性乳腺癌C-erbB-2、ER、PR的表达情况.结果 C-erbB-2、ER、PR阳性表达率分别
总结了我国自然科学外国教材资源的发展现状和特点,分析当前面临的四大问题:学科覆盖不够全面、经费不足导致购买力下降、文献保障率不高且学科差距明显、服务影响力弱化;指
蒸汽养护是生产混凝土构件的主要工艺环节之一。一般常在养护坑(室)中进行间歇蒸养,这种工艺除了存在占地大、劳动条件差等缺点外,由于间歇蒸养,必须反复加热养护室,造成了
目的探讨西药临床合理用药的安全性和有效管理措施,从而保障临床用药安全。方法以用药管理实施后2017年1月~2017年10月收治的80例西药治疗患者为研究组,以2016年1月~2016年12