论文部分内容阅读
随着网络技术的发展和持续完善,为使用户获得更好的用户体验,诸多个性化推荐系统不断涌现。协同过滤技术是传统个性化推荐系统中发展较为完善、应用较为广泛的一种推荐技术,但随着信息技术、网络技术等的不断发展,该系统自身固有的数据稀疏性、用户/项目冷启动以及系统可扩展性等问题越来越成为制约其发展的瓶颈所在。在实际生活中,两个个体之间往往只在某一方面品味相似。传统的个性化推荐算法往往忽略这一事实,在计算用户相似度时将所有项目都考虑进来;另外,协同过滤算法固有的稀疏性问题也会导致核心步骤中最近邻很难被定位,系统的推荐效果收到了极大的影响。本文针对影音视听领域广泛使用的协同过滤推荐系统的某些缺陷进行改进,旨在深入挖掘用户潜在兴趣,在考虑用户评分偏好和兴趣迁移的基础上,得到更为精确、多样的推荐结果。基于上述考虑,本文提出了一个基于模糊理论和协同过滤的个性化推荐方法。论文首先介绍了近年发展迅速的基于模糊理论的数据挖掘技术,为本文提出的个性化推荐方法提供技术支撑;随后概述了个性化推荐系统中常见的几种推荐技术,并在讨论现有电影推荐系统的基础上,深入分析了协同过滤算法的优缺点,提出了新的数学模型对传统协同过滤技术进行改进;最后在原有工作基础之上给出了基于模糊理论和协同过滤的个性化推荐方法的完整系统架构。本文的主要工作分为以下几个方面:首先,在概念分层的基础上,引入“隶属度”和“可信度”概念,利用模糊支持向量机算法对项目进行模糊聚类,利用模糊C均值分类算法对各项目类的用户进行可信度量,本文提出的个性化推荐方法利用上述方法,从两个角度入手通过简单降维和缩减数据集的方式,既改善了稀疏性问题,又可以降低推荐搜索范围,进而提高算法的可扩展性;其次,通过引入“评分偏好”和“兴趣迁移度”概念,提出新的用户相似性度量方法和预测评分公式,对传统协同过滤技术进行改进,使改进后的协同过滤推荐准确度有一定程度的改善;最终,改进后的协同过滤技术对每一个项目类进行分别推荐后,整合每个项目类中推荐项目的所有相关信息并利用本文定义提出的加权模型对其进行加权排序,完成最终推荐。实验结果证明,本文提出的个性化推荐方法既可以扩展推荐结果的多样性,进一步发掘目标用户的潜在兴趣,又可以使推荐结果更具准确度、时效性和可解释性。本文的不足之处在于未考虑实际生活中部分用户不喜欢给项目评分,直接假设所有用户都会为自己浏览过的项目评分,在之后的研究中会尝试先对用户浏览过的未评分的项目估算评分;本文提出的数学模型没有足够的理论支持,需要进一步优化改进;此外,为保证可扩展性,存在大量离线计算,定期更新数据库会导致实时性问题,这也是未来研究的一个方向。