协同过滤推荐算法的稀疏性与可扩展性问题研究

来源 :湖南科技大学 | 被引量 : 0次 | 上传用户:guoweijie000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着服务计算与云计算的迅速发展,越来越多的应用以云端服务的形式由开发商提供给用户,由此引发了服务数量的爆炸式增长。面对庞大的候选服务群,如何迅速定位符合用户个性化需求的服务已成为亟待解决的问题之一。个性化推荐系统能够把用户潜在的、模糊的需求转变为现实的、明确的需求,帮助用户过滤无效信息,有效地缓解了这一问题。其中,协同过滤推荐技术由于算法简单,推荐准确率高,成为个性化服务推荐领域应用最成功的技术。但是,随着系统中用户和服务数目的增加,用户-项目评分矩阵变得越来越稀疏,严重影响了协同过滤算法的推荐质量。此外,面对系统中海量数据,协同过滤算法的可扩展性也面临着严峻的挑战。本文针对协同过滤算法的稀疏性问题和可扩展性问题展开详细研究:首先,基于服务调用次数与用户兴趣之间的非线性关系,采用Logistic函数来计算用户兴趣,不需使用用户评分数据,从而改善算法的稀疏性问题。其次,采用离线用户聚类算法对原有大规模用户数据进行聚类,实时计算过程中仅在与目标用户同属一簇的用户中寻找最近邻居,提高推荐效率。具体而言:第一,针对协同过滤算法的稀疏性问题,提出一种基于Logistic函数的协同过滤推荐算法。首先通过分析用户对服务的历史调用记录,利用调用次数代替传统方法中的用户评分;然后引入Logistic函数对调用次数进行标准化处理,使其更合理地反映用户兴趣;最后在此基础上结合传统协同过滤算法预测用户感兴趣的服务来进行推荐。第二,针对传统协同过滤算法可扩展性较差的问题,提出一种基于用户聚类的协同过滤算法。该方法首先结合调用次数和服务的关键词,得到用户对服务关键词的偏好情况,并利用TF-IDF方法计算用户对关键词的偏好度,构建用户-关键词偏好向量,以此进行用户聚类;然后引入Logistic函数计算用户对服务的兴趣度;最后,在目标用户所在的聚类中寻找其最近邻居,根据最近邻居对目标服务的兴趣度预测目标用户对目标服务的兴趣度。最后,论文对上述方法的有效性进行了分析与验证。
其他文献
国际上的小学科学教育的基本取向正在发生转变,从偏重知识传授转向全面培养科学素养。而在培养科学素养的过程中,仅让学生经历现象形成经验,无法构建科学的认知结构。只有主
现今,物业管理在住宅小区中发挥的重要作用,日益显示出物业管理己经构成房地产行业中一个重要的新兴子行业,从1981年第一家物业管理公司在深圳成立起,发展到现在已经超过30年
高层建筑设计中的低碳设计,是我国建筑节能设计的重点发展的方向。可以增加我国能源可持续发展战略。文章就高层建筑的特点与低碳节能设计的必要性以及建筑低碳设计理念的重
"党要站在时代前列带领人民不断开创事业发展新局面,必须以改革创新精神加强自身建设,始终成为中国特色社会主义事业的坚强领导核心。"这是党的十七大报告的重要指示,学习贯
本文通过对 GSM-R 系统的介绍,分析了 GSM-R 系统在我国铁路应用的优势。
目的:对近年文献报道的各地医院儿科门诊抗菌药使用情况进行综合分析,为促进抗菌药临床合理应用提供参考依据。方法:对检索8篇文献报道49 146张处方进行综合统计,分析其各项
在分析咸宁市体育产业存在问题和面对的发展机遇的基础上,借鉴国外成功经验从培育体育市场、调整体育产业结构以及如何通过手机应用APP平台,从体制、模式、目标、布局、结构
生物化学是一门实验性课程,探寻高效、创新的实验教学方法势在必行。随着移动媒体的快速发展和普及,微信已成为大学生生活和学习中重要的工具。为探索微信公众平台在生物化学
<正>近几年屡次发生的网络安全事件说明网络安全形势非常严峻,采用传统的网络安全设施已经无法应对当前形势,有必要建立一套新型的网络防御系统。动态行为分析和网络流量分析
[目的]分析肱骨远端后外侧钢板治疗肱骨下1/3骨折的疗效。[方法]采用切开复位肱骨远端后外侧钢板内固定治疗肱骨干下1/3骨折25例。[结果]25例内固定手术患者,平均随诊10.2个月,优1