基于分步聚类和相似度优化的协同过滤算法

来源 :大连海事大学 | 被引量 : 1次 | 上传用户:zhangyanmin2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,协同过滤技术是个性化推荐系统中使用较广泛、应用较成功的一种个性化推荐技术。但在实际应用过程中,随着推荐系统规模的扩大和内部数据量的增多,协同过滤推荐技术暴露出了"数据稀疏性"、"扩展性差"和"推荐精度低"等问题。针对协同过滤算法存在的不足问题,本文提出了基于分步聚类和相似度优化的协同过滤算法。首先,针对协同过滤算法存在的扩展性差和数据稀疏性问题,本文在基于聚类的协同过滤算法基础上,提出一种分步聚类策略。在对项目和用户进行分步聚类操作时,本文引用了一种改进的K-means算法,避免了初始聚类中心选择的过于近邻而导致算法陷入局部最优解。分步聚类策略旨在提高算法的扩展性,缓解评分数据过于稀疏对聚类结果的影响。然后,针对协同过滤算法中相似度的直接计算而导致推荐精度低的问题,本文根据评分预测公式推导出了用户之间相似度的优化算法。并在分步聚类的基础上,利用相关簇类中的评分数据对用户之间的相似度进行训练与优化,旨在不失算法扩展性的同时,提高相似度的计算准确度,从而提高算法的推荐精度。最后,为了验证本文算法的推荐性能,进行了实验验证与结果分析。实验结果表明,与传统、基于用户聚类和基于项目聚类的协同过滤算法相比,本文提出的改进算法提高了协同过滤算法的推荐精度,具有较好的推荐质量。
其他文献
<正>改革开放30多年来,随着经济发展和居民收入水平的快速提高,以及全社会慈善意识的增强和慈善氛围的改善,我国已经具备了发展慈善事业的经济和社会基础。同时,由于我国城乡
研究果胶酶和壳聚糖对猕猴桃果汁的澄清作用,确定两种方法最佳工艺参数,并测定澄清前后果汁主要成分的变化,观察澄清汁的贮藏稳定性。
印染废水具有色度深、CODcr高、成分复杂、水量大及水质多变等特点,对环境水体影响较大。随着纺织工业新产品和新技术的发展,印染废水中可溶性染料、活性染料和化学浆料的数量和种类
随着量子通信技术的迅速发展,量子通信已经进入实际规模化组网阶段,因此量子保密通信网络性能的优化对网络规模的扩展、网络资源的合理利用均有着重要的意义。路由算法是网络
目的探讨抑郁症患者抗抑郁剂治疗与白细胞减少的关系。方法病例组为符合《中国精神障碍分类与诊断标准(第3版)》(CCMD-3)的抑郁症患者,入组后分别予艾司西酞普兰、帕罗西汀、
<正>经过改革开放30多年的发展,我国经济实力与综合国力得到了大幅度的提高,但从总体上看,东西部区域之间仍然存在着较为严重的发展不平衡现象。这种社会的非整合性,必然会造
<正> 一、引言在苏联对离心浇铸过程的研究和认识以及它在冶金和机械制造工业部门中的广泛应用,已经使这种浇铸方法成为铸造工艺中的独立学科。尤其是在离心浇铸理论的研究上
目前,中小企业是我国国民经济发展的重要力量。但是,一直以来,中小企业都存在融资难的问题,主要是因为中小企业资产规模小,财务数据的可靠性较差,经营风险较大等原因。商业银
<正>为深入了解加拿大公务员培训体系、相关法律法规以及具体做法,国家发展改革委培训中心于2013年组织了赴加拿大"公务员培训体系及其评估机制"培训团。来自国家发展改革委
幽默作为日常生活中常见的语言现象,一直以来受到了学者们的广泛关注,研究问题主要集中于幽默的表现形式、产生机制等等。格莱斯提出的会话合作原则与言语幽默有着密切的关系