协同过滤系统的稀疏性与冷启动问题研究

被引量 : 0次 | 上传用户:mybose
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统通过预测用户对项目的喜好程度来为用户进行信息过滤,应用知识发现技术来生成个性化推荐。协同过滤是一种常用的减少信息过载的技术,已经成为了个性化推荐系统的一种主要工具,然而现有大多数协同过滤算法存在着几个主要问题:精确性,数据稀疏和冷启动问题。许多结合协同过滤与基于内容的信息过滤的算法可以解决这些问题,但是这些算法需要预先得到项目的内容信息或者用户的个人信息,而这些信息在很多推荐系统中是无法获得的,因此无法利用基于内容的信息过滤技术。 本文提出了在无法得到项目的内容信息和用户个人信息的情况下,在数据稀疏和冷启动情况下提高预测准确性的几种方法。在三个公开的数据集上进行了试验,试验结果显示这些方法比常用的算法效果要好。 我们采用了两种方法来提高数据稀疏时预测的准确性,即属于特征递增型的Pear After SVD方法和属于转换型的LCM_STI方法。在特征递增型方法中,一种方法的输出用来作为另一种方法的输入。Pear_After_SVD算法首先利用基于奇异值分解的方法来得到预测的评分,然后采用这些预测结果来获得活动用户的邻居,最后用基于邻居的Pearson算法得到最终提供给用户的预测值。在转换型方法中,推荐系统根据当前的情况决定在不同的推荐方法中进行转换。LCM STI算法设置了一个阈值来决定如何在基于潜在分类模型的Pearson算法与STIN1算法这两种协同过滤方法中进行转换。在基于潜在分类模型的Pearson算法中,首先使用潜在分类模型的结果来进行邻居选择,然后根据最近邻方法来对活动用户未打分项目的评分进行预测。试验结果表明这两种方法在数据稀疏时准确性较高。 冷启动问题包括新项目问题与新用户问题。我们采用了基于统计的众数法以及信息熵法来解决冷启动问题。在基于统计的众数法中,利用人们的从众心理,对新用户问题,我们用所有用户在某一项目上的评分的众数作为新用户在
其他文献
本文系统地总结了目前国内外型钢混凝土的应用、试验和有限元仿真研究的现状。以有限元为工具,钢材采用三折线强化模型,混凝土采用损伤塑性模型,采用分离式模型和弥散裂缝模
目的比较大肠菌群酶底物滤膜法与传统膜过滤法、固定底物技术法用于水中大肠菌群检测时是否具有等效性。方法采集60份水源水水样,用三种方法同时进行检测,检测结果用ISO 1799
<正>如今,美军单兵系统已简化到了由智能手机手持终端与手持电台为核心组成的系统。2012年10~11月,在美国陆军NIE 13.1演习中,"奈特勇士"单兵综合作战系统采用了摩托罗拉公司
企业失败研究是一个重大的课题。在我国建立社会主义市场经济的过程中,必须有一批企业退出,从而为其他企业的发展创造良好的条件。这就需要政府部门深刻认识企业与市场的本质
本文以20世纪90年代前后美国兴起的公共新闻为研究对象,通过文献研究,勾勒了美国公共新闻事业发展的概况,重点探讨了美国公共新闻兴起的社会背景、理论背景以及公共新闻理论
兴起于20世纪70年代的项目融资是逐渐成为国际金融市场上的一种新型筹资方式,并且近年来已经发展成为大型工程项目建设筹集资金的一种卓有成效的手段,在国际上得到了非常广泛
斜拉桥施工过程仿真计算是实施施工控制的基础,本文以江苏省淮安市五河口特大斜拉桥为工程背景,应用结构仿真技术和施工控制理论,对PC斜拉桥施工仿真与控制进行了研究。
当前,公司企业人员受贿行为已构成我国市场经济建设的一个大毒瘤,也是我国反腐斗争的一项重要内容。本文将对公司企业人员受贿罪展开系统性地研究,全文总共由四个章节构成。
在社会主义市场经济条件下,一些人对集体主义存在认识误区,对坚持集体主义道德原则产生了动摇和怀疑。笔者认为集体主义仍然是社会主义市场经济社会的主导价值观,只是随着改
随着我国旅游业的飞速发展,各地政府都将旅游作为支柱产业和重要产业大力扶持。旅游目的地的建设、运营成为各地刺激经济增长的重要工作内容之一。旅游目的地品牌营销作为旅