论文部分内容阅读
由于数字图书馆具有丰富的信息资源和便捷的操作性,在近几年内其得以快速的普及和发展。当前比较成功的数字图书馆系统有ACM数字图书馆,中国知网(CNKI)等,但是它们面临着用户无法快速找到自己所需资源的问题,个性化的推荐技术是解决这一问题的最好方法。个性化推荐技术在数字图书馆服务中的应用,不仅为用户提供了个性化的内容,简化了用户操作,也提升数字图书馆的资源利用效率,达到了双方的共赢。推荐技术是本论文的主要研究内容。在众多的推荐技术中,协同过滤推荐技术是个性化推荐技术中被广泛使用的技术之一,论文主要讨论的是基于用户的协同过滤推荐技术。协同过滤技术面临的诸多问题中,数据稀疏性问题是最为严峻的。该问题会导致传统算法无法准确计算用户间的相似度,进而影响最终的推荐效果。虽然传统的评分矩阵缺省值填充方法可以缓解这一问题,但效果并不是非常理想。数据稀疏性问题也是本论文的主要研究的内容之一。本论文的主要研究内容有:对于数据稀疏性问题,论文中提出了改进的项目评分预测方法,即将用户间评分项目的并集作为用户间的共同评分项,利用项目间的相似度预测用户对未评分项目的评分值,该方法可以更准确地计算用户间的相似度;与此同时,论文对传统的皮尔森相关系数公式进行了改进,提出了评价系数的概念,以更加准确地衡量不同热门程度间用户的真实相似度;最后,论文对传统预测评分公式进行了改进,通过利用基于标签的方法和基于项目的协同过滤方法计算项目间的相似度,来预测预分公式中邻居集用户对未评分目标项目的评分值。在数据集movieLens的基础上,论文验证了改进的算法比传统的算法拥有更高的推荐精度,可以有效地解决数据稀疏情况下无法准确衡量用户间相似度的问题。最后,将改进的算法应用到一个数字图书馆推荐系统中,并得到了相应的推荐结果,推荐结果表明改进后算法要比传统的算法具有更好的推荐精度。