利用离群点检测改进协同过滤推荐算法

被引量 : 0次 | 上传用户:lifan_cuit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子商务的迅速发展,导致网络消费群体数量不断增加,网络信息也随之大量涌现。商品推荐技术能根据用户的不同需求为用户提供个性化的服务,因此它在电子商务系统中得到了广泛的应用。协同过滤推荐算法是目前应用的最有效的算法之一,但该算法仍存在着一些问题,比如容易受人为因素干扰产生噪声数据,系统中用户和项目数量的增加导致了数据稀疏性。论文在传统协同过滤推荐算法的基础上针对其存在的问题提出了一些改进方法。主要研究内容如下:(1)提出一种改进的用户评分相似度计算方法。用户评分相似度计算是推荐系统的第一步也是最为关键的一步,它决定着目标用户邻域的选取。相似度是通过用户对项目的评分和项目均值来计算的,与传统方法相比,能较好的度量用户评分之间的相似度。(2)利用基于密度的局部离群点检测算法去除目标用户邻域中的噪声数据。确定目标用户的邻域后,在邻域中利用局部密度离群点算法计算每个用户的离群因子,根据预先设置的阈值,去掉离群因子较大的用户,然后利用邻域中剩下的用户进行推荐。(3)利用基于用户特征的填充评分方法缓解数据稀疏度。若用户历史评分过于稀疏,则难以为用户提供准确的推荐。在利用协同过滤算法产生推荐之前,先依据具有相同特征的用户对项目可能拥有相似的评分这个原则来填充评分矩阵中未评分的项目,进而缓解了数据稀疏性,使预测评分更加精确。(4)采用MovieLens数据集对论文提出的算法进行实验,实验结果表明改进的算法能够进一步提高推荐系统的质量。
其他文献
近年来,以危险方法危害公共安全罪的适用范围不断扩张,使得该罪有向口袋罪发展的倾向。本文在肯定该罪立法价值的基础上,针对该罪在实践中扩张适用的问题,从犯罪构成要件的角
目的探讨过敏性鼻炎的食疗方法。方法针对过敏性鼻炎患者不同临床表现和处在本病的不同发生阶段,进行中医辩证来进行食疗。结果通过对患者进行中医辨证食疗,过敏性鼻炎患者的
奥运吉祥物的设计是奥运会成功举办不可或缺的重要组成部分和必要元素。作为平面到立体的延展,奥运会吉祥物的设计已经成为了一种艺术表现形式,它用自己特有的优势担任着传播
闽台文化同根同源,80%的台湾居民的祖籍地在福建。一部部族谱记录了福建各姓氏祖先迁徙台湾、发展台湾经济的历史轨迹,利用、发挥族谱所特有的血缘文化价值,以谱为媒,加强海
<正>"郭家海名师工作室"是专门研究中小学写作教学的工作室,领衔全国中语会"十二五"重点写作课题,下辖三十个子课题,系统研究小学—初中—高中写作教学。"高考美文写作学院"
作为铁路运输企业,神华包神铁路公司对办公的要求不仅局限于纸质化办公,更希望依托互联网,创造方便、快捷、高效、节约的办公环境。随着铁路信息化建设的全面开展,通过利用网
<正>以问答体例阐述中国音乐历史发展的全貌,涵括了古代、近代、现代及当代音乐的历史脉络;以突出各个历史时期音乐文化概貌与学科基础知识为特色,涵盖中国音乐史学领域的发
钛基氧化物(TiO2、Li4Ti5O12)因比容量较高、安全性能好、循环性能稳定、可快速充放电、廉价易得、环境友好,被视为最有发展前景的锂离子电池负极材料。但由于电子、离子电导
基于一类sum-product模糊推理算子、重心解模糊化法和单点输出的典型模糊控制器的解析结构推导,深入分析了输入隶属函数对模糊控制系统性能的影响,提出了隶属函数的系统化设
高等学校英语应用能力考试旨在检测我国高职高专学生以英语为工具进行日常和与未来工作有关的英语应用技能。考试分为笔试和口试,全面检测考生的实用英语交际能力;其信度、效