基于CUR分解的偏好处理方法研究

来源 :烟台大学 | 被引量 : 0次 | 上传用户:hebeihuazi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐算法在电子商务平台发挥着越来越重要的作用,推荐算法的好坏直接影响用户的体验,进而影响着电子商务平台的收入。因此提出好的推荐算法并对提出的算法进行优化是本文研究的重点。具体来说,推荐算法需要综合分析历史用户数据和电子商务网站实时的用户数据,进而分析用户的偏好特征,最后向用户推荐其感兴趣的商品。因此对用户偏好特征的分析是推荐算法的重点研究内容。因为用户的数据是动态变化的,因此要求推荐算法也要能够分析动态数据。因为电子商务平台存储了海量用户数据,因此推荐算法面临着大数据的问题,如内存溢出,高计算复杂度等问题。针对推荐算法面临的这两个问题,我们提出来一种两阶段推荐算法框架—CUR/C+RSVD,先利用CUR降低数据维度,初步提取用户特征,再利用RSVD进一步提取用户特征并进行推荐。力求从偏好特征的提取以及推荐的速度和准确度上有所提高。具体工作如下:首先,利用CUR矩阵分解方法降低内存以及提取用户特征,即先使用CUR矩阵分解方法将原始矩阵分解成、、这3个低维度矩阵,其中矩阵包含了物品的潜在特征,矩阵包含了用户的潜在特征,矩阵将用户的潜在特征和物品的潜在特征联系起来。矩阵和矩阵都是由原始矩阵中真实的行和列构成,因此提取的用户特征和产品特征具有很好的可解释性。其次,利用RSVD矩阵分解进行预测和推荐,在原始的RSVD分解中,高计算复杂度主要体现在计算与上,我们通过将替换成CUR或者将计算复杂度从(8)29))降低到((828)+(89)8)6)(8)(其中(8是数据矩阵的维度,8)和9)是输入矩阵的行和列,是算法循环迭代的次数,6)(8)是特征的数量。CUR/C+RSVD方法的优势是不仅仅能够快速处理大规模数据而且也能够保持原始数据的稀疏性。并且CUR/C+RSVD方法具有数值的稳定性和精确性。最后,通过算法的性质分析以及实验的结果分析,CUR能够对原始的评分矩阵同时进行提取用户的特征和物品的特征。和传统的正则化奇异值分解(RSVD)、奇异值分解(SVD)等矩阵分解方法相比,CUR矩阵分解具有抗干扰能力强、压缩率高、较好的可解释能力、解决大数据带来的高计算复杂度、精确度能够保证等优势。我们所提出的两阶段框架,即CUR/C+RSVD不仅能够有效地处理数据的稀疏性问题,也能处理大规模的低秩矩阵,与RSVD矩阵分解相比,CUR/C+RSVD获得了更好的预测结果(RMSE降低了的大约20%,NDCG提高了大约30%),并且在相同的数据集下,其运行时间比RSVD降低了大约70%。
其他文献
当今社会,信息技术高速发展,大数据的应用越来越广泛,各种数据已经渗透到社会的各行各业。因此,海量的数据成为了当今社会最具价值的一种财富,大量企业为了通过进行数据处理
因目标表面超出摄像机视场范围、回转体各部分之间相互遮挡或者测量精度的要求等原因,使得从任何测量角度都无法实现一次完成整个目标的三维测量工作,大型物体表面和回转体表面
2018年是内蒙古广播电视台蒙古语电视节目开播以来42周年。42年来,蒙古族电视人经过不懈努力和付出换来了今天蒙古语电视广播和世界先进民族电视文化的齐肩并进。现今,蒙古语
提出有效的打击伪基站方案对于安全部门有着重要的价值。由于打击和防治伪基站缺乏有效的分析工具和完善的决策机制,导致这种分析和决策的制定成为巨大的挑战,因为可供做出决策的垃圾短信数据从直观的角度来看是离散的、随机的,很难掌握其时空行为规律。在本文中,我们利用垃圾短信的定位、时间和内容数据,提出了一套交互式的可视化系统,通过三个层次,解决了上述两大主要挑战:首先探索垃圾短信的类型与时空分布之间的关系,可
平面-立体的转换是计算机辅助关键技术之一,本项目研究包袱皮平摊图与其包裹长方体物体之间的平面-立体相互转换关系。包袱皮为正方形布料,它可以包裹所携带的物品并方便携带,是
新课程改革要求重视学生的全面发展,强调课堂教学中学生的主体地位,合作探究学习法既是教师的教学法,也是学生的学习法,以其对提高学生语言表达能力和独立思考能力及对提高教
加蓬被认为是国际贸易中的一个国家,因为它在热带森林中拥有丰富的自然资源,占总陆地面积的85%。加蓬的大部分森林财富都在刚果盆地,这是目前世界上仅次于亚马逊的拉丁美洲美
随着数据存储与信息化技术的迅速发展,生物序列数据库的数据量呈现井喷式增长,生物序列上的近似查询难度越来越大。虽然有多种方法度量两个序列的相似度,但是普遍关注的方法
随着互联网技术的快速发展,网络中的文本以指数形式的速度增长向大众铺面而来。因此,如何提高新闻文本分类的高效性和准确性、提高高质量和智能化的新闻文本分类、快速提取出
结构决定性质,物质的微观结构是了解其物理性质的基础。因此,从微观原子尺度了解物质的结构及其变化规律有利于开发高性能的材料体系。液体结构对于研究其形核、结晶以及玻璃