软件众包平台项目推荐中小众用户问题研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:clvic
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,由于软件众包的高速发展,在软件众包平台上涌现了大量的用户和项目,为了帮助用户快速地发现最适合他的项目,学术界和工业界开始研究软件众包平台的推荐系统,其中最常用的推荐算法是协同过滤推荐。但协同过滤却面临小众用户问题。所谓小众用户(Gray-Sheep),是指其偏好与大多数人不同的一些用户,协同过滤因为倾向于推荐流行和热门的项目,所以无法向小众用户推荐合适的项目。为解决小众用户问题,本文分析了小众用户在整体用户中的分布以及对推荐系统的影响,设计了甄别小众用户的算法,在此基础上提出了两种小众用户推荐方法。第一种方法甄别小众用户和大众用户,分别进行不同策略的混合推荐,适用于用户数量变化和对可解释性要求高的场景;第二种方法采用栈式自编码器,对小众用户和大众用户同时进行统一的深度协同过滤推荐,适用于用户数量稳定和不要求解释推荐结果的场景。本文主要的贡献和创新点包括:(1)构建软件众包平台用户画像,计算用户基础特征向量和兴趣特征向量,并分析用户多类型行为,构建隐式评分矩阵。在此基础上提出可以在多种场景下使用的小众用户甄别算法,包括基于邻域、基于密度、基于角度、基于线性模型和基于非线性模型共五种算法。(2)提出了基于混合推荐的项目推荐方法,该方法结合协同过滤、基于内容和基于图的三种推荐方法进行加权式混合,并将混合推荐的推荐列表整合问题转化为有监督训练问题,分别对小众用户和大众用户进行推荐。(3)提出了基于深度协同过滤的项目推荐方法,该方法把用户画像、项目画像和(隐式)评分矩阵嵌入到隐式因子空间中,结合矩阵分解和栈式自编码器,使得可以直接计算用户与项目之间的预测评分。本文在多个软件众包平台的数据集上进行了系列实验,实验结果证明,在软件众包平台上小众用户占总用户数量的15%-25%,这使得该类平台的协同过滤推荐效果差强人意。本文提出基于混合推荐的项目推荐算法和基于深度协同过滤的项目推荐算法,相比现有的推荐算法,整体推荐平均召回率分别高10.74%和12.63%,小众用户推荐平均召回率分别高56.65%和48.25%。
其他文献
当试验所具备的人力、物力、财力、时间有限时,无重复因析试验被广泛应用于实际生活中.然而无重复因析试验存在一个缺陷,即没有多余自由度对试验的误差方差进行估计,除非牺牲
<正>作品说明:立足冈沟河水环境现状,遵循生态性、适应性、人文性的设计原则,合理规划滨河空间和场地功能,营造出集休闲体验、文化展示、调蓄雨洪、生态修复于一体的水环境景
背景和目的:在我国,鼻咽癌居各种恶性肿瘤的第8位,在头颈部的恶性肿瘤中鼻咽癌的发病率则居首位,是我国重点防治的十大肿瘤之一。目前,有关鼻咽癌肿瘤抗原的研究还仍然集中于研究E
现代散文是语文教学的主导文类,在初中语文教材中占据重要地位。“部编本”初中语文教材中的现代散文在编排上呈现出一定的特征,与此同时语文教学也需要作出相应的调整。本文以“部编本”初中语文教材所选的现代散文为研究对象,运用文献研究法、数量分析法、案例分析法等研究方法对“部编本”初中语文教材现代散文的编排特点进行研究,探寻具体的散文教学策略。第一章界定“部编本”初中语文教材现代散文的相关概念,阐释编选理念
目的:糖尿病性骨质疏松症(diabetic osteoporosis,DOP)是糖尿病(diabetes mellitus,DM)患者体内出现骨量丢失、骨组织改变以及骨折表现的全身性代谢性骨病,受多种因素影响。
借助福柯的权力理论,可以对《欲望号街车》有深一层的分析:在史丹利—史蒂拉—布兰奇的三角权力关系中,布兰奇是受害者,在交织的权力关系网中,她处于如此不利的位置中,因此她
针对醋酸与异丁烯加成酯化合成叔丁酯的反应液,提出先脱酸后提纯的两塔精馏分离流程,采用AspenP lus软件进行模拟研究.在采用简捷计算方法获得精馏塔初步配置参数的基础上,用
目的探讨家长参与式护理模式在高危新生儿(高危儿)护理中的应用效果。方法选取2016年3—12月入住该科的高危儿60例作为研究对象,按照入院先后顺序分为对照组和观察组,各30例
“横看成岭侧成峰,远近高低各不同。”这说明不同的视角或不同的“学科之眼”可以发现不同的问题、带来不同的发现与体验。社会性别视角是本研究所采纳的方法论视角。这一视
以张泾河水利枢纽工程为例,介绍了船闸底板混凝土配合比的选定方法以及类似大体积混凝土浇筑的施工方法,总结了保证混凝土质量的措施。