面向稳定性问题的SVD++线性回归推荐算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:chppxhn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,个性化推荐系统技术在电子商务,广告销售等互联网行业中应用极其广泛。推荐系统在没有明确的用户需求环境下,仅通过分析用户行为就能为用户的兴趣进行建模,提供千人千面的信息和产品。本文针对基于传统协同过滤算法存在的扩展性弱、数据稀疏和推荐准确率低等问题,在第三章提出一种改进模糊划分聚类的协同过滤推荐算法。在传统基于修正余弦相似度计算方法上,引入时间差(timediff-item)因子,热门产品(popular-item)权重因子以及冷门产品(Nonfashion-item)权重因子以改善相似度计算结果,避免人为客观因素造成相似度计算结果远偏离真实情况;同时引入改进模糊划分的GIFP-FCM算法,将属性特征相似的产品聚成一类,构造索引矩阵,同索引间根据产品间的相似度寻找产品最近邻居构成推荐,来降低计算复杂度。为测试GIFP-CCF+算法的有效性,在Netflix数据集和MovieLens数据集上通过与Kmeans-CF、FCM-CF和GIFP-CCF推荐算法进行仿真对比实验,证明了GIFP-CCF+算法在推荐结果和推荐精度上具有一定的优越性。GIFP-CCF+推荐算法存在容易受到聚类簇数影响而导致推荐结果不够稳定的缺点。为此,在第四章提出一种引入时间效应的SVD++线性回归推荐算法timeSVD++LR,该算法模型继承了SVD++模型运用评分数据预测的特点,将用户和产品两方面的信息融合隐式反馈信息映射到一个维度为f的隐语义空间,用户和产品之间的交互作用被建模为该空间中的内积。通过描述用户和产品在各个因子上的特征来解释评分值,且融合了时间效应属性,该时间效应属性中,用户偏置和产品偏置均与用户和产品相关,以改善时间因子欠缺稳定性的问题;同时根据预测评分构造特征向量X~k,将原始训练数据作为线性回归模型的输入,采用梯度下降算法优化最终代价函数,生成回归参数向量theta使得代价函数值最小。将特征向量X~k和回归参数向量theta带入到预测模型中,利用预测模型求得对测试集数据的预测评分。基于MovieLens数据集上的仿真实验结果表明,timeSVD++LR算法的推荐准确性较RSVD、SVD++和timeSVD++算法模型有显著提高。与GIFP-CCF+算法相比较,timeSVD++LR算法具有更好的稳定性。
其他文献
题组作为众多测验中的一种常见题型,由于项目间存在一定程度的依赖性而违背了局部独立性假设,若用项目反应模型进行参数估计将会出现较大的偏差.题组反应理论将被试与题组的
干部考察是干部选拔任用的重要环节。但在具体工作中,仍存在精准度不够的问题:干部考察“蜻蜓点水”,不深入、不具体,对干部的了解掌握停留在表面印象中,致使干部特点不清,“千人一
报纸
利益衡平在形式推理、实质推理、法律解释方法选择、法官自由裁量权规制方面具有重要作用,它决定法官自由裁量权的正确行使,左右着法律适用的进程中方法、工具的选择,决定着
PBL教学,即"以问题为基础的学习",是一种全新的教学模式。相比传统的"以授课为基础的教学",PBL教学中老师的角色由知识的传授者转化为引导者,而学生也从被动灌输知识转变为自
会议
如何聚合来自不同IDS的报警以减少重复报警是分布式IDS研究的重要问题。设计了一种入侵检测消息交换格式(IDMEF)报警消息格式规范,通过对IDMEF数据模型中的Alert类扩展而成,可统
关于汉斯·忧那思责任伦理代表作,国内许多学者迄今都以为1979年法兰克福出版社德文版《责任原则》与1984年芝加哥大学出版社英文版的《责任的命令》是在思想内容和观点见解
清季新政时期,清政府对官吏制度进行了前所未有的变革,这对20世纪初的中国社会变迁产生了很大影响,官吏制度变革促进了中国官吏投制度的早期现代化,对中国人思想观念变迁以及社会
GCr15轴承钢棒材在轧制后的冷却过程中往往会有网状碳化物的形成,对轴承钢的质量和寿命产生影响。通过Gleeble3800热模拟试验机对其轧制后的控冷工艺进行模拟研究,结果表明:在86
痧症,是多发于夏秋两季,因感受风寒暑湿燥火六淫之邪气或疫疠之秽浊出现的一些病症。临床表现为头痛、咳嗽、烦闷、头面肿痛、眩晕胸闷、手足肿痛、身体肿痛、脘腹痞满、恶心呕
中国农户的信用问题一直是许多人所关注的焦点,也是政府和金融机构针对农村金融市场特点解决农村地区资金严重匮乏和不足必须要考虑的问题之一。本文通过将中国农户的信用问