论文部分内容阅读
随着各种终端智能设备的普及化,互联网广告载体逐渐从PC端转移至移动终端。移动广告是一种依托终端设备的新型营销方式,欺诈检测和广告推荐是当前移动广告信息服务中的两个主要问题。由于欺诈行为通常模仿合法用户的操作行为且快速迭代进化,识别恶意操作应用广告的应用发布者十分困难。本文提出一种基于二模图的传播方案(iBGP)以识别移动广告系统中恶意移动应用的广告欺诈问题。通过充分研究移动广告用户的行为,本文识别出两个显著模式:幂律分布及针对性,并建模融合两者设计出一个能自动学习非种子节点的初始得分的算法。在传播阶段,所有节点的分值在用户-应用加权二模图中传播直至收敛。通过在真实的移动数据上进行实验,结果显示,iBGP优于现有流行的图传播算法。在移动广告推荐问题上,文本在协同过滤框架下研究了两个子问题,隐式反馈评分和近邻Top-推荐问题。对于隐式反馈评分问题,现有方案普遍凭直觉将隐式反馈转化为二值得分或数值得分,这类方案容易欠拟合或误表达隐式反馈的真实意义。本文提出一种能根据用户的可见反馈列表计算隐式反馈评分的隐式反馈量化模型,该模型包含排序和评分两个步骤。为验证模型的可行性,本文在Spark平台上实现了本方案,并采用真实的移动广告数据集进行测评,结果表明该方案在近邻模型和隐语义模型上均优于现有算法。针对移动广告大规模推荐系统下的近邻Top-推荐问题,本文提出一种融合用户上下文信息的近邻Top-推荐算法(MobRec),该模型包含基于用户聚类的相似性计算和Top-排序的两阶段推荐方案。MobRec结合移动用户的特征分类及相似性融合,将用户的相似性计算划分为离线聚类阶段和在线最近邻计算阶段。在得到最近邻信息的基础上,本文提出一种针对移动场景优化的用户偏好模型以提供精确的Top-推荐结果。本文在Spark架构上实现了本算法和对比算法,并在真实移动广告数据集上实验,结果显示MobRec优于对比的协同过滤算法。