基于聚类的协同过滤算法研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:sanmumuren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤算法存在的冷启动问题,难以针对用户偏好做出个性化推荐,导致用户流失;存在的数据稀疏问题导致计算用户或项目间相似度的不准确性,降低了推荐精度;存在的扩展性问题导致计算最近邻居时搜索空间庞大,消耗大量的时间。为了缓解协同过滤存在的问题所带来的影响,本文针对存在的数据稀疏和扩展性问题做了以下工作:针对算法存在的数据稀疏问题,本文依据预估值填充的思想,采用了加权Slope One算法对评分矩阵空缺处进行填充。计算项目类型矩阵中类型相似度和项目评分矩阵中项目相似度,将两者通过参数进行线性组合得到最终的项目相似度,相似度高的前M个作为邻居项目,通过加权Slope One算法对待评分项目进行预估值,并填入用户评分矩阵。引入项目类型相似,可以避免相似度低的项目的干扰,提高预估值的准确性。针对算法存在的扩展性问题,本文引入了聚类的思想。根据评分矩阵获取用户已评分项目数量和评分值;再根据项目类型矩阵获取已评分项目类型;通过计算感兴趣程度提取用户偏好模型,利用优化聚类中心的k-means算法进行用户聚类;计算目标用户与聚类中心点的距离,找到所在的簇,簇中的点作为邻居用户。再结合已填充评分矩阵,利用改进的公式计算目标用户与邻居用户的相似度和预测评分。聚类可以缩小目标用户的搜索空间和降低算法的时间复杂度,进而改善系统的扩展性问题。本文基于MovieLens数据集,对基于项目类型相似加权Slope One算法预测模块在协同过滤中的有效性以及本文算法与其他算法推荐精度的比较两个模块进行实验验证。实验结果证明本文提出的对算法的优化是有效可行的,提高了算法预测的准确度和推荐的质量。
其他文献
鳜(Siniperca chuatsi)是我国优质淡水鱼的重要品种,但随着鳜养殖技术问题的解决和养殖规模的逐年扩大和养殖密度的提高,严重的病害问题已成为限制鳜养殖业发展的主要瓶颈。特别是1994年起由传染性脾肾坏死病毒(Infectious spleen and kidney necrosis virus,ISKNV)引起的鳜虹彩病毒病最为严重。因此,对其开展深入研究以及免疫防控研究意义重大。病毒
中国古诗词文化拥有几千年的沉淀,博大精深的中国文化与国外艺术歌曲创技法相互融合,创造出与众不同的古诗词类艺术歌曲。艺术歌曲《大江东去》作为其中的优秀作品,演唱者需
<正> 丹参又名赤参,为唇形科植物丹参Salvia milti-orrhiza Bge.的干燥根及根茎,具有祛瘀止痛、活血通经、清心除烦等功效。丹参为生产复方丹参片、复方丹参滴丸等中成药的原
河南省周口市地处河南豫东平原.是一个拥有上千万人口的农业大市.无线电行政管辖区共有10个县(市、区)、2个省辖农场和1个经济技术开发区。近年来.随着经济发展.周13市各类无线电台
采用基于密度泛函理论的Materials Studio(MS)程序包中的CASTEP程序优化了TiO2(101)晶面、五氯硝基苯(PCNB)结构和TiO2(101)对五氯硝基苯的16种吸附结构.计算了最佳吸附位点,吸附能,
<正>棺与椁是墓葬的基本内容,《韩非子·内储上》:“布帛尽于衣衾,材木尽于棺椁”;《管子·尽藏》:“棺椁足以朽骨”。秦人的丧葬习俗曾受到了周代传统礼制的影响,棺椁也不例
会议
随着经济和城市化的快速发展,火灾发生的频率和事故损失明显增大,导致亡人的火灾事故时有发生。火灾事故调查是消防工作中的重要组成部分,准确认定火灾原因、科学总结人员伤亡教训一直是火灾事故调查领域所面临的难题。现阶段某些复杂火灾事故仅通过常规火灾事故调查流程所认定的火灾原因有时较为抽象,难以被受灾群众理解和接受。随着计算机仿真能力的飞速发展,基于火灾动力学理论和数值模拟方法,采用计算机火灾仿真技术模拟火
目的:探讨非营养性吸吮在早产儿喂养中的应用及其效果。方法:将38例需经鼻胃管喂养的健康早产适于胎龄儿用同一种配方乳喂养。将其随机分为非营养性吸吮组18例和营养性吸吮组
目的研究分析烫伤烧伤治疗的临床疗效。方法回顾性分析110例烫伤烧伤病人的临床资料,并研究分析药物疗效。结果治疗后所有患者均恢复良好。轻中度烫伤患者皮肤愈合良好,治疗
期刊