论文部分内容阅读
互联网广告效果是互联网运营领域最关注的话题,因为它直接影响互联网运营商的切身利益与用户的购物体验,广告运营商的诸多任务均已以互联网广告效果作为重要的参考依据。因此,评价互联网广告效果就成为一直以来学术界和工业界的研究热点,具有非常重要的研究意义和商业价值。然而,由于网页的广告效果由诸多复杂异构的因素共同决定,除了广告本身以外,还与页面格局、用户类型、浏览轨迹等因素相关。因此,如何发现一种更科学、更真实的互联网广告评价指标和评价模型极具挑战性。首先,互联网广告效果多以广告点击率(Click Through Rate,CTR)和转换率(Conversion Rate,CR)等为评价指标,二者均为粗粒度、不精确的显示评价指标。点击率指标忽略那些用户注意到、并形成一定印象,但并没有付出具体点击行动的广告,而转化率指标将用户对网页内容的浏览和对广告的浏览混为一谈;其次,目前评价互联网广告的数据集信息源单一,完整性差,缺少足够的隐式信息,如用户在关注网页时的情绪、用户本身性格等,无法基于多源异构数据构造精确的评价模型;再次,目前的互联网广告效果评价方法多基于用户无差别假设和页面无差别假设。用户无差别假设忽略了用户类型不同所造成的行为方式差异。页面无差别假设把整个网页视为一个整体,不考虑页面的不同布局、广告所在位置对用户行为的影响,难以体现用户对网页不同兴趣区域的行为差异。最后,互联网广告评价模型的建立过程中多基于静态位置特征,缺少对时序动态特征的刻画,忽视了用户行为是一种时序序列。针对上述问题,本文提出了一种融合多模态特征、多重因素和时间序列信息的互联网广告效果评价方法。本文主要工作和创新点如下:(1)提出新的互联网广告效果评价指标。针对互联网广告评价模式单一,评价系统实时反馈不足问题,本论文提出“印象空间”互联网广告效果评价指标。首先,利用心理学印象理论构造印象空间,设计一个向量来模拟大脑的印象空间,模拟的印象空间简化为一个由多因素构成的向量,将复杂的定义性语言通过一段向量表达;其次,选取浏览过程中可能影响关于互联网广告的印象空间建立的的主观因素和外部因素,利用对比研究、整体分析方法寻找这些内、外因素如何影响印象空间的构建,选取关键性、表达性、多样性的因素通过一系列的排列组合方法构造多形态印象空间;最后,利用数学统计中的相关性实验分析和偏离程度检验,研究印象空间的科学性和有效性。(2)大规模多源异构数据采集。针对互联网广告推荐缺乏个性化,广告计算效率延迟问题,本论文进行多源异构数据数据采集。首先,基于心理学行为理论和方法、收集用户信息,包含静态信息与动态信息;其次,利用网页设计方法和眼动追踪收集网页布局内容信息和用户页面操作等信息;之后,利用模糊集理论对采集的数据进行量化和标准化处理;最后,通过相关性分析方法,集成多源异构数据,形成大规模在线互联网广告评价数据集,验证不同的数据表达对互联网广告效果影响的程度,为消除用户无差别假设和页面布局无差别假设奠定数据支持。(3)消除用户无差别假设。针对互联网广告推荐缺少个性化的问题,本论文提出用户类型差异化评价方法,实现用户类型划分。首先,利用模糊决策方法,量化多源异构的用户属性;其次,集成量化后的属性,定义集成属性,并利用将集成属性划分至不同域;最后,利用最优化组内平方差和聚类方法寻找最佳的用户类型种类数,依据此分析各类用户的等。实验证明,不同类型用户具有不同的点击行为和浏览习惯。(4)消除页面布局无差别假设。针对网页页面无差别对待问题,本论文提出基于兴趣区域的用户差异性行为研究方法。首先,掘互联网广告和网页条目布局,定义基本搜索引擎下网页页面布局状态;其次,利用注意时效定义页面兴趣区域;最后,筛选兴趣区域内用户的行为数据,利用关联规则挖掘不同用户的点击行为特点;利用多频子路算法挖掘用户的浏览偏好。实验证明,用户对于网页页面的重点关注区域呈F形,不同的兴趣区域内会产生不同的行为偏好。(5)建立融合多重因素、多类别特征和时序特征的级联互联网广告效果评价模型。在上述工作基础上,本论文提出基于多模态特征和时序特征互联网广告效果评价模型。首先利用马尔科夫链,寻找特征的的时序特性;其次,构建由梯度提升树(Gradient Boosting Decision Tree GBDT)模块、因式分解机(Factorization Machines FM)模块、域因式分解机(Field Factorization Machines FMM)模块、局部马尔可夫链模块(Partially Observable process Makorv POM)等多模块级联的深度学习框架;最后,建立基于多模态特征和时序特征级联模型,实现互联网广告效果精准预测,并分析模型复杂度和模型性能。