论文部分内容阅读
网络技术的飞速发展,广告成为网络盈利的一个主要手段。网络广告为越来越多的企业和机构所了解,并且大部分企业和机构都进行了网络广告的投放。但是,网络广告形式多样,具有动态性。网络广告投放的随意性和泛滥性,使网络用户应接不暇,产生了厌烦的情绪,使网络广告的投放达不到预期的效果。针对这种情况,出现了精准广告投放这一概念。精准广告投放即向网络用户投放其感兴趣的,并真正能够及时供用户所需的广告信息。而通过对用户的行为分析,对用户进行智能地分类,成为实现精准广告投放的有效方法,那么对网络上的海量用户进行智能分类就成为进行精准广告投放的重要研究内容。由于海量的网络用户信息,采用数据挖掘方法,可以有效地对用户进行智能分类。然而由于所获得信息的实时性与在线性,即在互联网下的用户的行为信息是不断变化的,致使这些海量的信息并不能一次性全部获得。而对于分批获得数据,一般的分类算法,需要不断地重新的更新分类模型,而耗费了大量的时间。增量学习则是对训练数据集的学习过程逐步展开,后续的学习结果是建立在先前学习结果的基础上的。同时,鉴于贝叶斯分类方法能够充分利用先验知识学习这一特点,在一定程度上解决了先验信息传递的问题。因此,本文提出一种基于贝叶斯的增量学习算法用于对精准广告投放系统中用户的分类,它是一个利用样本知识来修正当前知识的连续的、动态的过程。通过对在线用户的行为特征不断进行分析,根据获得的数据信息利用贝叶斯增量学习对用户进行分类,不断地更新分类模型,以达到更好的分类效果,从而更有效地实现精准广告的投放。本文选择了Book-Crossing(BX)数据集作为实验研究对象,它包括278858个用户(匿名但有人口统计信息),提供了对于271379本图书的1149780评分信息。通过利用SQL Server 2005处理成实验所需的数据格式。研究结果表明,增量学习对于在线的实时学习能够解决其他分类器所带来的时间与精力的耗费,并能获得较好的分类效果,从而精确地、及时地对网络用户的分类,达到精准广告投放的目的。本文对精准广告投放系统进行了设计,从系统分析到系统功能的实现都进行了论述,并提出主要是将用户推荐模块作为一个通用接口,不仅在本系统中可以应用,在其他的网站中,只要将代码嵌入并做相应的调整,就同样可以实现对当下网站的用户的分类。本文结论部分对整个文章进行了总结,并提出下一步工作。