基于改进协同过滤的评分预测推荐系统研究

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:henban
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,人们能够快速与便利地接收信息,与此同时,制造信息也非常的简单快速。目前,人们处在一种信息飞速增长的时代。但是,如何快速准确地选择自己感兴趣的信息内容?对于解决这一问题,推荐系统做出了一定的贡献。本文通过两个实证数据集Movielens1M和Movielens100K,在传统的协同过滤算法的基础上,提出改进的算法。一方面,分析了考虑评分值大小对推荐效果的影响,并进一步提出融合隐含信息来改进协同过滤算法。另一方面,通过分析传统的MSD算法的不足,提出额外考虑评分向量间的余弦值来改进MSD算法。具体的工作内容如下:
  (1)研究了基于有效评分及隐含信息的推荐系统。首先对所研究的评分数据进行了分析,考虑使用部分评分偏好来改进传统的协同过滤算法。在评分矩阵的基础上,通过对评分的二值化处理,提出基于二值化评分矩阵的协同过滤算法。实验结果表明,基于二值化评分矩阵所取得的推荐准确度优于基于原始评分矩阵的协同过滤算法。
  进一步在二值化评分矩阵的基础上,本文融合了隐含信息,提出基于有效评分及隐含信息的改进协同过滤算法。对于用户和对象的相似度,分别融合用户基本信息和对象特征信息。对于基于用户的协同过滤算法,在计算用户间的相似度时,除了传统的评分向量间的相似度,本文基于二值化评分矩阵并额外融合用户基本信息,提出基于有效评分及用户基本信息的改进协同过滤算法。对于基于项目的协同过滤算法,本文分析了对象的特征信息与评分的关系,提出融合对象特征信息来改进算法。基于有效的评分,通过考虑对象的发布时间、类型信息,分别提出了融合对象发布时间信息、融合对象类型信息和联合考虑对象特征信息的改进协同过滤算法。通过在多个相似度算法上实验,并与传统的协同过滤算法相比发现,本文所提的几种算法取得了更优的推荐效果。
  (2)研究了考虑评分向量的余弦值来改进传统的MSD算法。分析了传统的MSD算法的不足,额外考虑评分向量的余弦值,并分别基于用户相似性和对象相似性的MSD算法,提出融合评分向量的余弦值和均方差值的改进IMSD算法。在两个数据集上进行实验表明,本文提出的IMSD算法的推荐准确度优于传统的MSD算法。另外,研究了MSD的两种优化算法,一种是结合JAC算法和MSD算法的JAC_MSD算法,另一种是额外考虑了妥协性和一致性因子的AC_MSD算法。进一步,本文将IMSD应用于改进该两种算法,提出两种优化算法JAC_IMSD和AC_IMSD算法。实验结果表明,本文所提的IMSD、JAC_IMSD和AC_IMSD较传统的MSD、JAC_MSD和AC_MSD算法,无论是考虑所有近邻或是部分近邻的情况下,都有更好的推荐准确度。因此,在MSD算法基础上考虑评分向量余弦值的IMSD算法能够取得较好的推荐效果,并且在进行推广应用时,JAC_IMSD和AC_IMSD算法仍然能够取得更高的推荐准确度。
  综上所述,本文主要对传统的协同过滤算法进行了一些改进。其一,通过分析评分信息和隐含信息影响,提出考虑有效评分及隐含信息来改进先前的算法。其二,分析传统MSD算法的不足,提出一种改进的MSD算法,并将IMSD算法进行推广,提出JAC_IMSD和AC_IMSD算法。
其他文献
近二十年来,网络文学的风生水起日渐改变着传统文学以及文学批评的整体面貌与发展格局,与之相应,人们对于网络文学的认识开始从自发走向自觉,并进入理性的思考和学理的探究,特别是新近的数年,学术界对于网络文学及批评的持续关注使其研究逐渐进入到文学理论与文学批评的学术前沿,并取得了诸多具有学术价值与现实意义的研究成果。本学位论文以批评文体视角为切入点做关于网络文学批评文体的现象及价值研究,具体操作如下:首先
学位
本文试图创建一个批评框架,基于此“异史氏曰”在跨文化交际翻译译本中处理的必要性和可行性将得到有效的论证。 为了实现上述目的,讨论译者主体性的运用显得尤为重要。与此同时,必须意识到译者主体性的运用贯穿于跨文化交际翻译活动始终,且译者对译本的选择这一主体性行为应该成为跨文化交际翻译过程的起点。正因此,论文开篇引入阐释学理论对“异史氏曰”的源起加以讨论,为全文的论证奠定基础。 与此同时,作者发现译者主体
学位
大段骨缺损的修复是骨组织工程亟待解决的难题之一。传统的骨修复策略侧重新骨的形成,往往忽略了血管化的作用,新生骨组织需要周围的血管为其不断提供营养物质以满足细胞的存活和生长。因此,同时具有促进骨生成和血管形成能力的支架材料有望用于大段骨缺损的修复治疗。支架材料联合多种生长因子诱导骨生成和血管生成是骨组织工程常用的方法之一,但生长因子具有半衰短、容易失活等缺点,大大增加了使用成本。目前,许多小分子药物
基于新抗原识别的肿瘤免疫疗法中,对抗原表位能否被人类白细胞抗原(human leukocyteantigen,HLA)的准确预测是关键的一步。利用质谱鉴定的HLA多肽相对于利用亲和力实验鉴定的与HLA结合的多肽,包含更多细胞呈递抗原的信息。另外,特定细胞系或组织通过RNA测序得到的基因表达谱能够显著提高抗原呈递预测。尽管近年来积累了大量高质量的质谱鉴定的HLA多肽数据,但是只有很少一部分具有对应的
微生物驱动的元素生物地球化学循环不仅是人类认识地球与自然的基础科学,也为解决人类生存和可持续发展面临的资源匮乏、能源短缺、生态危机等问题提供了关键的科学技术。人类对自然界中各种元素生物地球化学循环途径的不断研究,既是对地球生态的深入探索,也是为人类面临的各种问题寻找解决之道。本文对从珠江水体中分离的化能自养硫氧化细菌Halothiobacillussp.LS2进行全基因组测序,发现其基因组中含有多
蛋白(多肽)药物是一类重要的生物大分子药物,有超过100种上市药物,全球年销售额约1000亿美元且迅速增长。然而,许多蛋白(多肽)药物的制备上存在严重的瓶颈,如大肠杆菌重组表达蛋白常遇到表达为无活性包涵体的问题,化学法在大于30个氨基酸的蛋白(多肽)合成上效率低、成本高的问题。本文基于实验室所创建的可切割自聚集标签(cleavable self-aggregating tag,cSAT)蛋白(多肽
学位
电力系统高压输电线路距离长,穿越的地域广阔,地质、气象条件复杂多变,运行时容易发生故障,并且绝缘子闪络等瞬时性故障约占90﹪~95﹪.这类故障发生以后,故障点的损伤不明显,给故障点寻找带来了极大的困难.故障定位技术有利于快速准确地寻找到故障点,缩短停电时间,提高线路的运行水平,具有现实的经济意义和社会效益.因此,多年以来故障定位的研究一直受到中外学者的重视.该文是在广泛阅读国内外输电线路故障测距有
物联网被认为是一个面向未来的高期望增长市场。目前,供电问题是制约物联网发展的巨大挑战之一。每年更换巨量的电池必然会造成极大的浪费,同时,电池所带来的环境污染、高额人工维护费用势必严重制约物联网发展。射频能量收集可以提供较为稳定的电能,保证物联网设备的正常工作。本文针对宽频带圆极化天线及其在射频能量收集中的应用进行了研究。设计了一款宽频带圆极化天线和宽频带问号型整流天线。具体内容如下:1)实现了一种
MassiveMIMO技术作为5G的关键技术之一,其基站侧的天线阵列数量可达上百根,可以明显的提高信道容量和频谱效率。但在部署中,天线数量增多导致射频链路增多,且下行链路中用户侧预处理难度增大,以至于影响在实际中的应用。因此,本课题研究MassiveMIMO系统中的天线选择技术和预编码技术。天线选择技术能够有效减少射频链路的成本并降低运算复杂度,预编码技术能够消除多天线之间的干扰,降低用户端的处理
学位
高维多目标优化问题广泛存在于实际工程应用中,但是其所得的非支配解集的规模会随着优化目标个数的增加而呈指数增长,这严重制约了决策者评价和分析优势解。高维多目标可视化技术以形象直观的可视化图形,能清晰明了地表达高维多目标非支配解集的重要信息,有利于降低分析和决策的难度。但是,高维多目标可视化技术的研究尚不成熟,在Pareto前沿信息表达的丰富性、目标属性判断的直观性、拓扑结构保持的有效性、映射点显示的