论文部分内容阅读
Web技术的日益成熟为互联网注入了活力,但是越来越多的数据让人们迷失在信息的海洋中,对人们有用的只是其中少之又少的一小部分。不同的用户面对的都是千篇一律的web页面。自1997年个性化首次被提出来,立即得到了积极的响应。研究web个性化方面的技术非常多,目前非常热门的web挖掘技术是个性化技术中一颗耀眼的星星,其中web日志挖掘通过挖掘web日志记录,来发现用户访问web页面的模式,通过分析和探究web日志挖掘记录中的规律,增强对用户的信息服务的质量,提高用户的满意度,并改进web服务器系统的性能,web日志挖掘具有很高的研究价值。
本论文针对现有的个性化方案的不足,提出了了一个基于web日志挖掘的个性化推荐系统模型。该系统分为web日志记录与预处理模块,模式生成模块以及推荐模块三个部分。日志记录和预处理模块完成用于实施挖掘算法的事务数据库的生成。模式生成模块对事务数据库实施挖掘算法,更新模式库。推荐模块根据当前用户的活动会话和配置访问模式库,生成针对该用户的推荐页面。论文提出了在web日志挖掘数据预处理过程中采用帧过滤预处理的算法,提高了web日志挖掘时候挖掘结果的兴趣度。这个结果也间接表明了,帧页面过滤技术可以提高基于web日志挖掘技术的个性化推荐系统所生成的推荐结果的质量。
论文首先对个性化概念、数据挖掘及web挖掘相关领域的知识和技术做了介绍,然后给出了各个模块的详细设计和功能模块的具体实现,并对一般的web日志处理过程的结果和通过帧页面过滤web日志数据预处理结果进行实验比较,得出加入帧页面过滤的数据预处理过程会得到更优结果的结论。最后探讨了该推荐系统模型的现实意义,存在的问题和下一步的发展。