论文部分内容阅读
当前互联网发展日新月异,伴随着各种互联网应用不断推出,网络应用数据也爆发式增长。面对如此海量的数据信息,用户已经无法直接的获取其所需要的有效信息。针对这种信息过载的问题,科研工作者提出了许多的解决方案。这其中具有代表性的且实现效果较好方案的就是推荐系统。尽管目前在推荐系统领域的研究成效显著,但是仍然还有一些难题等待解决,比如面对海量数据的处理问题、系统的冷启动问题、推荐效果的准确性问题等。另一方面,推荐系统的运行,需要尽可能的收集用户的信息及行为数据等,而且由于一些网络应用存在着漏洞导致用户数据泄露的事件也时有发生,因此如何有效保护用户隐私数据的安全也成为当前的一个研究热点。本文首先在系统阐述推荐系统的研究背景、基本原则及研究热点的基础上,归纳总结了当前常用的推荐模型及算法的实现方式及其优缺点。然后,本文以与社交网络分析相结合提高推荐系统准确度以及在推荐系统中用户隐私保护为主要研究点,提出了本文相应的解决方案,其中具体的研究内容有:(1)基于社交网络用户信息分析,提出了一种基于社交网络的用户相似度评分算法,算法通过建立用户信任度模型,充分利用社交网络用户个人兴趣信息,用户关系数据。另外对于数据稀疏的情况,采用了相似度的传递算法,有效缓解数据稀疏的问题,确定目标用户的最临近邻居集合,从而根据公式计算得到社交网络的用户相似度预测评分;然后针对基于模型的协同过滤算法空间复杂度较高,使用了一种改进的协同过滤算法,算法利用潜语义模型求解“用户特征-项目”评分矩阵,对求解的矩阵信息及用户特征信息采用线性加权的方式预测出用户特征评分;最后对于用户对项目的最终评分的预测计算,采用一种融合上述用户相似度评分及用户特征评分的学习算法。该算法利用用户相似度评分、特征评分、社交网络信息、用户特征数量等作为训练特征,以用户实际评分为标注信息,利用Fisher线性判别为训练模型预测用户对项目的最终评分。最终实验证明本算法取得较高的准确度。(2)考虑社交网络用户隐私保护的问题,提出一种基于项目特征相似度的协同过滤推荐算法。算法利用用户对特征相似项目群组的评价信息来推测出用户对某具体项目的偏好,进而进行推荐。从实验结果可以看出,算法在推荐准确度上有一定的损失,但是依然在可用范围内,并且由于系统的输入数据仅仅是一些泛化的数据,用户隐私得到了有效保护,因此本算法具有较高的实际应用价值。