论文部分内容阅读
互联网技术的快速发展,信息量呈爆发式的增长,人们正处在一个大数据的时代。在这样一个时代,人们不得不面对着海量的信息数据,要在这个数据的海洋中,找寻自己所需的信息就变得异常的困难一即信息过载问题。而个性化推荐系统提供了一个有效解决这一难题的方法。它利用已有的历史数据和实时数据挖掘每个用户不同的兴趣偏好,主动为用户推荐所需的信息。协同过滤是目前工业界中应用最广泛且最有效的推荐技术之一,也是学者们研究的热门课题。数据稀疏性和扩展性差是该技术面临的两大主要难点。针对这两个难点,本文做了一些研究和应用的工作:1.研究了基于物品的协同过滤算法的两个重要部分:评分标准化和相似性权重计算。对用户间平均评分差异性和物品间平均评分差异性更细致考虑的基础上,尝试了一个基于共同点评的评分标准化方法。而相似性权重计算方面,尝试了一个通过全局数据学习优化的方案。最终,将两部分的研究成果进行整理,提出了一个基于共同点评物品学习的协同过滤推荐算法。横向实验比较数据结果显示:新的算法相对于其他的算法能够更有效的利用已有数据,评分预测精确度上有小幅提升。2.从全局和局部数据特性两个角度探讨如何对协同过滤推荐技术进行混合。在分析现有的基于偏置估计和物品的混合算法、基于物品和奇异值分解模型的混合算法的基础上,结合上一部分的研究成果,提出了一个基于共同点评物品学习和奇异值分解模型的混合协同过滤算法。实验数据显示,新算法能够更有效的利用全局和局部数据特性,缓解数据稀疏性问题,明显的提高评分预测的精确度。3.在前几章协同过滤技术的相关研究工作和实践经验的基础上,设计了一个基于协同过滤技术的酒店推荐引擎。该推荐引擎核心技术主要是基于物品和基于奇异值分解变形模型(SVD++)的协同过滤推荐算法。该引擎将这两个算法有效的进行混合,缓解了的协同过滤技术工业应用的扩展性差的难题。同时,该推荐引擎能够根据用户最新的浏览记录,实时反馈给用户感兴趣的推荐结果,有着良好的用户体验。