移动广告欺诈检测与推荐算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:chenqiang_11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各种终端智能设备的普及化,互联网广告载体逐渐从PC端转移至移动终端。移动广告是一种依托终端设备的新型营销方式,欺诈检测和广告推荐是当前移动广告信息服务中的两个主要问题。由于欺诈行为通常模仿合法用户的操作行为且快速迭代进化,识别恶意操作应用广告的应用发布者十分困难。本文提出一种基于二模图的传播方案(iBGP)以识别移动广告系统中恶意移动应用的广告欺诈问题。通过充分研究移动广告用户的行为,本文识别出两个显著模式:幂律分布及针对性,并建模融合两者设计出一个能自动学习非种子节点的初始得分的算法。在传播阶段,所有节点的分值在用户-应用加权二模图中传播直至收敛。通过在真实的移动数据上进行实验,结果显示,iBGP优于现有流行的图传播算法。在移动广告推荐问题上,文本在协同过滤框架下研究了两个子问题,隐式反馈评分和近邻Top-推荐问题。对于隐式反馈评分问题,现有方案普遍凭直觉将隐式反馈转化为二值得分或数值得分,这类方案容易欠拟合或误表达隐式反馈的真实意义。本文提出一种能根据用户的可见反馈列表计算隐式反馈评分的隐式反馈量化模型,该模型包含排序和评分两个步骤。为验证模型的可行性,本文在Spark平台上实现了本方案,并采用真实的移动广告数据集进行测评,结果表明该方案在近邻模型和隐语义模型上均优于现有算法。针对移动广告大规模推荐系统下的近邻Top-推荐问题,本文提出一种融合用户上下文信息的近邻Top-推荐算法(MobRec),该模型包含基于用户聚类的相似性计算和Top-排序的两阶段推荐方案。MobRec结合移动用户的特征分类及相似性融合,将用户的相似性计算划分为离线聚类阶段和在线最近邻计算阶段。在得到最近邻信息的基础上,本文提出一种针对移动场景优化的用户偏好模型以提供精确的Top-推荐结果。本文在Spark架构上实现了本算法和对比算法,并在真实移动广告数据集上实验,结果显示MobRec优于对比的协同过滤算法。
其他文献
目的掌握桂林市食物中毒特点,为制定有效的预防措施提供依据。方法对桂林市1981~2004年发生的食物中毒数据进行归类分析。结果25年间发生食物中毒共323次,中毒5745人,死亡57人,夏
"色彩"和"建筑"之间有着密切的关系,色彩是建筑设计中的重要语言,也是极富表情的造型元素,它可以美化建筑的外部形象,体现建筑象征性,提高建筑的可识别性,同时还关系到一幢建筑的
论述了黑龙江省东部山区天然森林植物区系的特征及森林植被水平分布和垂直分布规律,为今后森林经营和保护提供了理论基础。
刘天华先生的琵琶曲《虚籁》,又名《今夕》《长夜吟》,曲风委婉含蓄,意境深远,蕴含了中国古代审美观。关于本曲,刘先生并未留有音响资料,也没有任何关于乐曲的描述,多年来,许
在鸡西市第一中学建设新校区的规划设计中,通过对总体布局、交通组织、场区竖向、运动场地及校园绿化等方面做详细的设计思考后再进行规划设计,使其设计效果和使用功能都达到