论文部分内容阅读
近年来,个性化主动信息服务的研究取得了很大的进展。而在个性化主动信息服务中最重要的服务就是个性化信息推荐。作为人工智能的一个重要研究领域,数据挖掘近年来有了广泛的应用。因此,两者的结合--基于数据挖掘的Web个性化信息推荐服务日益成为一个重要的研究课题。本文针对目前Internet上信息获取方面出现的矛盾和困难,提出了一个面向Internet的基于数据挖掘的Web个性化信息推荐系统,并研究了其中的关键算法。
Web访问挖掘预处理过程主要包括:数据净化、用户识别、会话识别、路径补充和用户事务模式识别等步骤,本论文针对各个步骤进行了详细的分析。
进而本文设计并实现了一个基于数据挖掘的Web个性化信息推荐系统,并给出了相应的推荐策略和推荐算法。该系统分为离线部分和在线部分,离线部分主要完成从站点服务器的访问Log文件中挖掘出适合在线智能个性化推荐服务的用户事务模式,采用了基于关联规则的挖掘方法。在线部分,实现基于关联规则挖掘的个性化智能推荐服务。基于关联规则挖掘的推荐方法利用用户自己的用户事务模式文件,生成聚集树,然后利用用户访问操作和聚集树来发现关联规则,最终生成推荐集。