个性化推荐技术中的互信息相似度应用研究

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:clear0102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着个性化推荐系统应用越来越广泛,推荐技术的研究也得到飞速发展。在广泛的个性化推荐技术中,协同过滤技术的研究和应用最为热门,但是在目前协同过滤推荐系统中用户评分数据非常稀疏的大背景下,协同过滤推荐系统的研究依旧面临着诸多问题和挑战。本文主要针对数据非常稀疏时传统的三种相似度度量方法过于片面或者不准确的情况,提出了一种基于互信息的用户相似度度量方法。本文主要研究了以下几项内容:  1)介绍了推荐系统的研究背景以及国内外研究现状,着重阐述了学者们结合信息熵对协同过滤系统展开的探索和研究。  2)分析了传统的三种用户相似度度量方法,包括Cosine相似度(Cosine Similarity)、皮尔逊相关系数(PearsonCorrelation Coefficient)、修正的Cosine相似度,并总结了各传统相似度度量方法的缺点。  3)在阐述了前人研究的成果和分析了传统相似度度量方法出现问题的成因后,本文提出了一种基于互信息的用户相似度度量方法,该方法通过计算两个用户对项目评分的互信息来衡量两个用户之间的相似度,并将Jaccard相似性系数引入到互信息相似度计算方法中,来弥补传统的相似度度量方法会夸大或缩小用户之间的相似度,造成相似计算准确度下降的缺陷。  4)将本文提出的互信息相似度度量方法应用到公开的MovieLens数据集上,把推荐的准确度作为评价标准,并与传统的相似度度量算法进行性能对比,实验结果表明,本文提出的的方法提高了推荐的准确度,改善了推荐系统的质量。
其他文献
在对烧伤患者进行治疗的过程中,对其烧伤程度的准确评估,是十分关键的一步,甚至直接决定了患者的生存质量。烧伤区域体表面积是烧伤程度的主要依据,准确、及时的烧伤区域体表面
近年来,随着信息技术的蓬勃发展,尤其是网络通讯技术、多媒体技术、数据库技术的发展,为企业和单位的电子公文流转提供了更为广阔的发展空间。在涉及到如何处理文档信息、如何管
随着网络的普及,越来越丰富的网络服务如雨后春笋般呈现在人们的视野中。这些服务以方便用户为宗旨,然而随着服务提供给用户的信息以爆炸式的方式呈现给用户,用户很难方便快捷的
随着网络的发展和Web资源的丰富,利用Web全文信息检索系统来获取所需信息已经成为人们日常生活的重要组成部分,用户也越来越关注如何能够更加准确、高效地查找信息。   本文
基于Internet的模拟法庭在Internet网络环境上为现代远程教育中的法学专业学生搭建了一个模拟教学实践平台,改善了原来分散教学中教学实践活动组织困难、缺少优秀师资和不便
污水处理的整个过程是一个非常典型的复杂动态生化反应系统,它具有非线性、时变性和不确定性等特点,很难用传统的数学方法建立相对精确的数学模型,而一些仪器仪表的测量过程严重
业务流程管理过程中最主要的步骤是流程定义和流程执行。流程定义一般通过业务流程定义模型来实现,流程执行通过与流程定义模型相适应的流程执行引擎来完成。为了实现将Web服
继电保护装置是保障电网安全运行的重要设备,而由继电保护装置自身问题造成的误动或拒动,将会严重地影响电网安全稳定运行,而继电保护设备测试平台有利于提前检测出继电保护
学位
Internet自诞生以来飞速发展,信息容量呈爆炸性趋势增长。如何从海量的信息中准确且快速地获取对人们有价值的信息,已成为一个非常重要的研究课题。信息检索作为获取信息的一