因子分解机模型在推荐领域的应用研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:xinhongwei678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的兴起带来了信息量的剧增,满足了用户对知识的需求和渴望。但随着网络急剧发展而引发的信息大爆炸,使得用户在海量数据面前,不能简单直接获取自己真正所需内容,反而导致有效信息的获取难度增加,形成信息超载现象。推荐系统是解决上述问题的主要手段之一。目前推荐领域主流模型是协同过滤算法,分为基于User和Item的协同过滤以及基于模型的协同过滤。基于模型的协同过滤算法中,又以矩阵分解系列算法为主要分支,但是其在迁移性上存在弊端。因子分解机系列模型能够仅通过改变输入的特征实值向量形式,去模拟常见的矩阵分解模型,如SVD++,PITF等,有效地避免了传统矩阵分解模型针对每一个具体任务都要去单独定义模型表达式和优化方法的弊端。因此本文将研究聚焦于因子分解系列模型。首先,用户-物品评分矩阵中隐含的用户行为信息在一定程度上反映了用户的兴趣偏好,对于推荐而言是非常有价值的信息,但是常见的协同过滤算法并没有将此信息进行很好的利用。针对上述问题,本文提出了word2vec和因子分解机的融合模型,即通过word2vec技术对此序列信息建模,并将输出作为因子分解机模型输入,去进一步提升因子分解机模型的评分预测准确率。以上融合模型,经实验证明,在降低评分预测误差上,取得了较好的收益。其次,领域因子分解机在因子分解机基础上,提出了field的概念,使得其在特征建模方面效果更好。但其通常用于分类问题中,而这里我们则将其用来解决评分预测这样的回归问题。并且为了进一步提升模型的效果,我们还将领域因子分解机模型和Mini-Batch Kmeans++算法进行融合,进一步提升领域因子分解机模型的评分预测准确率。实验结果证明了上述方案在降低评分预测误差上的有效性。
其他文献
品德优质课评比作为一项常规活动,其标准应该是:教材处理要优;目标定位要优;教学活动要优;教师素质要优。
翻译的根本目的是促进不同文化间的相互交流,文化中的重叠现象构成了翻译的可行性和可能性,而文化差异则构成了等值翻译中的一条难以逾越的鸿沟,《红楼梦》中大量富含特定文
雷锋精神的实质,新时代可以诠释为志愿服务。学雷锋活动的重要载体是开展志愿服务活动,它推动了我国志愿服务事业突飞猛进地发展,引起了有关方面的重视。然而我国高校志愿服
宏村的古建筑群落在历史的苍桑巨变中奇迹般完整地保存了下来,令人叹为观止的,它与周围的地形、地貌、山水相互渗透,取得自然和谐的统一。文章纵观宏村的古建筑特点,从古民居
目的:探讨2型糖尿病(type 2 diabetes mellitus,T2DM)患者的血红蛋白(hemoglobin,Hb)水平与糖尿病视网膜病变(diabetic retinopathy,DR)患病风险的相关性。方法:本横断面研究
建立了超声提取-分散液相微萃取联合气相色谱质谱法测定大气PM2.5中15种邻苯二甲酸酯的方法.样品经过二氯甲烷和丙酮(1∶1,V/V)提取后,以1,2-二氯苯为萃取剂、丙酮为分散剂,运
秘书工作的很多环节——起草文件、计划、总结,向上级汇报,为领导人提供决策依据等等——都需要资料,平日不注意收集整理,必然会“用时方恨少”。我国古代杰出的秘书人才,早巳懂得
中国的20世纪是民族觉醒后追求民主的开启阶段,无数有识之士从各自的角度,各自的领域探求民族强盛、民智自觉的切近道路,民主成了人们追求的一种生活方式。然而。自由主义者
基于STM32F103单片机设计了一种透射式光电水质浊度分析仪.采用一种浊度传感器探测经待测样品的透射光,光电转换后的电信号分别经过低噪声放大器和A/D转换器后转变为数字信号
在当前能源短缺和节能减排的大趋势下,低能耗光源已成为研究热点。白光LED(light emitting diode)因其具有寿命长、效率高、能耗低、节能环保等优点而正在逐步替代传统照明成为新一代绿色光源。目前,商业化白光LED的实现方法有两种。一是通过InGaN基蓝光LED芯片激发黄色荧光粉(YAG:Ce3+)得到黄光,并与未被完全吸收的蓝光组合成白光。另一种方法是使用近紫外LED芯片激发三基色荧