论文部分内容阅读
随着计算机与网络技术的普及和发展,传统的图书正逐步被数字图书替代。数字图书以其价格低、信息量大、借阅方便等优势获得到了前所未有的发展机遇。但数字图书检索耗时、利用率低、缺乏个性化服务、缺少主动的信息推送服务等缺点也在一定程度上阻碍了它的发展。 为了克服上述数字图书系统的缺点,本文设计并实现了一个基于关联规则和协同过滤的个性化信息服务系统。通过设计并实现一个异构环境下的搜索引擎,实现了对在不同平台下运行的数字图书的检索,该搜索引擎能记录用户的使用情况,为个性化信息服务系统完成用户信息的收集工作;通过对协同过滤算法的改进,实现了实时在线处理;针对Apriori算法的一些缺点,提出并实现了Napriori算法,从优化产生2-项目集、事务压缩、项目压缩、连接优化等几个方面对经典的Apriori算法进行了优化,提高了规则生成的效率;提出了一种关联规则挖掘的扩展方案,较好的解决了无效规则及冗余规则问题。本系统通过协同过滤和用户关联两种方法产生邻居用户集,再根据邻居用户集的浏览历史,使用URL关联生成推荐信息。通过使用信息推送和信息拉取相结合的方式,主动或被动地将推荐信息提供给用户,同时利用 web2.0的Ajax技术,设计并实现了一个支持用户定制和拖动的个性化主页。最后,通过在广西科普平台上的部署和使用试验,证明了该系统的有效性。