基于隐含相似度和度量学习的社会化推荐算法研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:tffx7677
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的推荐系统通常主要专注于充分利用用户-项目的评分信息,而随着推荐系统应用场景的不断扩展,仅仅依据用户-项目间的二元评分关系进行相关推荐,往往无法获得令人满意的推荐效果。社会化推荐系统将社交信息作为辅助数据,试图通过考虑社交网络中的社交关系和评分数据来提高推荐系统评分预测和项目排序推荐任务的准确性。目前,学者们针对社会化推荐算法取得了一系列研究成果,但依然存在如下不足:(1)虽然已将社交关系融入了相似度的计算之中,但是社交关系和评分数据中的隐含信息并未得到充分挖掘;(2)社会化推荐算法采用了矩阵分解中点积方式,这种方式的固有不足会造成推荐结果的误差;(3)评分预测和项目排序是推荐系统的两大任务,虽然可通过融入社交关系来提高推荐准确率,但项目排序的依据依然是评分信息。针对以上存在的问题,本文重点开展了如下工作:(1)提出了一种融合信任关系和用户隐含相似度的推荐算法。该算法同时考虑用户分别作为信任者和被信任者时与其好友间的相似度,间接实现了信任传递,从而更全面利用了评分信息和信任关系的隐含信息。同时,算法利用用户特征向量来计算用户的评分相似度,而不需考虑共同评分集合;利用信任关系的特征向量来计算用户的社交关系相似度,而不需考虑共同好友集合,有效消除传统的相似度函数由于缺失共同对象而造成的数据稀疏性问题。此外,算法对防止过拟合的正则化项进行了自适应加权约束,实现了修正误差的最小化。在两个数据集的一系列对比实验结果表明,该方法有效提高了推荐系统评分预测的准确性,并且能有效地缓解数据稀疏性和冷启动问题。(2)提出了一种基于度量学习的社会化推荐算法。该算法可用于评分预测和项目排序两个经典的应用场景,并分别对应评分预测社会化推荐模型和项目排序社会化推荐模型。算法中引入距离度量学习,弥补了矩阵分解点积方式的不足,并使整个过程更具有直观意义和解释性,该方法分四步实现了评分预测和项目排序的推荐任务。首先,将偏好矩阵(评分矩阵或隐式反馈矩阵)转化为距离矩阵;其次,引入置信机制,为相对可靠的评分设置更高的置信程度,同时通过度量学习对距离矩阵进行分解,将用户和项目嵌入到统一的低维空间;然后,通过距离约束,拉近用户与偏好项目和信任好友间的距离,推远用户与不喜欢的项目和不信任好友间的距离,从而更充分挖掘了社交关系对距离的影响;最后,得到用户和项目在低维空间的位置后,分别应用于评分预测和排序推荐两个应用任务。在两个数据集的一系列对比实验结果表明,该方法有效提高了评分预测的准确性以及项目排序推荐的精确率和召回率,并且也能有效缓解冷启动问题。综上,数据稀疏问题、冷启动问题、社交关系和评分数据中的隐含信息挖掘不充分等问题在本文研究中都得到了较好解决。提出的融合信任关系和用户隐含相似度的推荐算法,为解决社会化推荐系统中相似度的计算问题提供了很好的解决思路。提出的基于度量学习的社会化推荐算法,为如何更好地将社交关系与传统推荐系统进行融合的研究提供了新的方法,为社会化推荐系统中的评分预测任务和项目排序推荐任务问题进行了有效的改善优化。
其他文献
量子隐形传态是量子网络和可拓展量子计算的重要组成部分,凭借其广阔的应用前景吸引着学术界的广泛关注。量子隐形传态的目的是利用纠缠资源和经典通讯实现量子信息从一个端
近年来,随着计算机技术,现代传感器以及成像技术的高速发展和广泛应用,人们需要处理,分析和恢复维度更高,规模更大,结构更加复杂多样的数据。而在采集和传输过程中,这些高维
随着当事人在普通民事诉讼中提请财产保全申请的数量增多,因财产保全申请错误而损害被申请人和第三人利益的赔偿纠纷也日益增多,但关于财产保全错误损害赔偿纠纷的法律适用,
新《预算法》第35条规定省级政府可在国务院批准的限额内发债,且明确指出地方政府不被允许采用其他方式筹集投资建设所需要的资金。自此地方政府不得再以融资平台此类形式变
微博发展迅速,是一种流行的在线社交网络。微博用户数量巨大,且内容具有实时性,因此它是研究人员挖掘公共安全相关信息的有用工具。基于微博的公共安全事件提取和风险评估,一
在这项研究中,我们检查了MRI图像处理算法的当前状态。我们分析了一些基本方法,并根据我们的观察结果,开发了一种图像处理算法来预测癌症的可能发展。在提出的算法中,结合了
现行《环境保护税法》第9条对于环境税的征收范围进行了规定,通过文义解释和法理解释,确定环境税征收范围,应当区分不同的污染物种类,而分别对每一排污口排污量较多的几项污
二十世纪晚期,科学工作者在冷原子方面的研究兴趣空前高涨,取得了许多重要的成就。随着冷原子研究的发展,大家开始关注冷分子可能呈现出的新的物理和化学现象,对其研究产生了
随着经济的发展和人民生活水平的提高,家庭购买商业保险的现象越来越常见,逐渐成为家庭理财的重要方式之一。随之而来的是法院在离婚诉讼中面临的保险权益分割的难题。由于家
行人重识别指的是,采用计算机视觉的技术,判断在视角不重叠的区域内不同摄像头捕捉到的行人图像是否来自同一个行人的过程。由于行人重识别中用于训练的数据集需要跨多个摄像