论文部分内容阅读
随着计算机的普及和互联网技术的快速发展,网络上的信息量迅速增长,信息过载问题成为目前首要解决的问题。传统的搜索引擎技术由于被动的服务方式和缺乏个性化等缺点已不能满足用户的需求,推荐系统应运而生。协同过滤推荐作为目前应用最成功的数据挖掘技术之一得到广泛的关注和研究。通过检索文献发现,目前对协同过滤推荐系统的研究多集中在精确性问题上,多样性和动态变化问题的研究并不多,因此本文将重点针对这两个问题展开研究,本文的研究工作主要如下:(1)介绍推荐系统的初衷、定义,概述当前主流的推荐算法,着重介绍协同过滤推荐算法,包括该推荐算法的思想、分类和推荐步骤。同时阐述了目前常用的评价指标,包括精确性评价指标和多样性评价指标。(2)针对协同过滤推荐系统的多样性问题,本文设计了基于项目类别属性的协同过滤推荐算法,该算法以基于项目的协同过滤推荐为基础,融入项目的类别属性信息,定义了项目类别贡献函数,并用它对预测评分公式进行改进。算法的原理是通过降低与待评分项目类别完全相同的项目的得分、提高与待评分项目类别不完全相同的项目的得分,来提高推荐的多样性。最后实验结果表明改进的算法提高了推荐的多样性。(3)针对协同过滤推荐系统的动态变化问题,现有改进主要是针对用户兴趣变化、物品生存周期和时间热点效应三个方面进行,忽略了具有周期性消费特征的物品对推荐产生的影响。针对这一现象,本文设计了基于时间周期性加权的协同过滤推荐算法。该算法在时间加权的基础上,考虑到时间周期因素的影响,定义了周期贡献函数,并用它对预测评分公式进行改进。算法的原理是通过增强处于活跃期的评分对推荐产生的影响,从而达到更高的推荐精确性。最后经过多次实验证明改进的算法具有更高的推荐精确性。本文针对推荐系统多样性和动态变化问题进行了探究,提出了基于项目类别属性的协同过滤推荐算法和基于时间周期性加权的协同过滤推荐算法。前者不同于一般的改进算法从结果出发进行改进而是从源头分析寻找改进方法,改进的算法在对推荐多样性要求较高的场景中十分适用;后者除了考虑到用户兴趣的变化,首次融入周期性行为对推荐产生的影响对算法进行改进,改进的算法在具有周期性消费特征的场景中优势明显,具有很好的应用前景。最后通过实验证明了两个算法的有效性。