面向数字图书馆的协同过滤推荐算法的研究

来源 :武汉理工大学 | 被引量 : 3次 | 上传用户:sunjava2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于数字图书馆具有丰富的信息资源和便捷的操作性,在近几年内其得以快速的普及和发展。当前比较成功的数字图书馆系统有ACM数字图书馆,中国知网(CNKI)等,但是它们面临着用户无法快速找到自己所需资源的问题,个性化的推荐技术是解决这一问题的最好方法。个性化推荐技术在数字图书馆服务中的应用,不仅为用户提供了个性化的内容,简化了用户操作,也提升数字图书馆的资源利用效率,达到了双方的共赢。推荐技术是本论文的主要研究内容。在众多的推荐技术中,协同过滤推荐技术是个性化推荐技术中被广泛使用的技术之一,论文主要讨论的是基于用户的协同过滤推荐技术。协同过滤技术面临的诸多问题中,数据稀疏性问题是最为严峻的。该问题会导致传统算法无法准确计算用户间的相似度,进而影响最终的推荐效果。虽然传统的评分矩阵缺省值填充方法可以缓解这一问题,但效果并不是非常理想。数据稀疏性问题也是本论文的主要研究的内容之一。本论文的主要研究内容有:对于数据稀疏性问题,论文中提出了改进的项目评分预测方法,即将用户间评分项目的并集作为用户间的共同评分项,利用项目间的相似度预测用户对未评分项目的评分值,该方法可以更准确地计算用户间的相似度;与此同时,论文对传统的皮尔森相关系数公式进行了改进,提出了评价系数的概念,以更加准确地衡量不同热门程度间用户的真实相似度;最后,论文对传统预测评分公式进行了改进,通过利用基于标签的方法和基于项目的协同过滤方法计算项目间的相似度,来预测预分公式中邻居集用户对未评分目标项目的评分值。在数据集movieLens的基础上,论文验证了改进的算法比传统的算法拥有更高的推荐精度,可以有效地解决数据稀疏情况下无法准确衡量用户间相似度的问题。最后,将改进的算法应用到一个数字图书馆推荐系统中,并得到了相应的推荐结果,推荐结果表明改进后算法要比传统的算法具有更好的推荐精度。
其他文献
随着互联网的快速发展,互联网上的各种应用也越来越多,随之而来的信息安全问题也日益严重。本文是作者在参与了非结构数据中心项目,对相关的安全技术进行了进一步研究之后所撰写
随着Internet的快速发展,IPv6(InternetProtocolVersion6)所能提供的巨大的地址空间以及所具有的诸多潜在优势和功能,使其成为构筑下一代网络的重要基础,使提供语音、数据、视频
近年来,随着大规模城市建设的兴起,在工程建设过程中的矛盾也日益突出,如工程设计图需要具备一定的专业知识才能看懂,而工程项目社会的参与度却越来越高,导致了沟通困难,另外对项目
移动对象数据库是近年来发展起来的一门技术,其索引技术是直接影响数据库性能的主要因素之一。目前,对移动对象数据库索引技术理论的研究还刚刚起步,研究的成果主要集中于运动不
本文结合软件建模在软件开发中的作用的实际情况,就当前一般软件建模通用性强,难以掌握,且不能实现完全代码生成等问题进行了分析。就节省软件开发时间、提高软件质量等进行了深
随着Internet/Intranet的日益普及,Web已成为共享和传播信息的主要渠道之一,UML建模语言、RUP统一过程、XML信息交换标准、.NET架构、Web Service、JavaScript脚本、组件技术
同时多线索SMT(Simultaneous Multithreading)体系结构在每个周期内允许有多条独立的线索发射指令。这样,处理器内部就存在有多个同时活跃着的上下文,它们每个周期都会竞争处
虚拟细胞是在计算机上模拟真实细胞的结构、物质组成、生命活动的动力学行为和生命现象。虚拟细胞的发展虽然只有十几年的历史,但是它对疾病防治、科学研究、社会生活等方面
MIMO-OFDM系统内组合使用两种关键技术:多输入多输出(MIMO,Multi-Input Multi-Output)天线和正交频分复用(OFDM,Orthogonal FrequencyDivision Multi-plexing)调制。MIMO技术
信息系统维护(包括移植)是软件生命周期的重要一环,是信息系统不断增强实用性与可靠性的重要措施。本文作者根据用户实际需求,对企业已有的生产准备WEB信息系统进行了维护性