论文部分内容阅读
在信息化的时代,人们面临海量的信息带来的信息爆炸问题,越来越多的信息使得人们获取有用信息的耗时越来越多,面对这一问题推荐算法是一种有效的解决思路。而推荐算法在商业领域的成功使得其在图书领域的应用成为了可能。推荐算法种类繁多,其中最成功、使用最广泛的无疑是协同过滤推荐技术。本文通过对各种主流的推荐技术的分析比较,选取了一种基于图模型的协同过滤算法,针对面临的数据量太大,矩阵维度太高带来的效率问题,使用了一种改进型聚类算法对原矩阵进行降维。同时,考虑到图书借阅数据没有评分信息的问题,提出了一种由借阅时长计算评分的思路,并提出了一种图书推荐模型,同时通过实验验证了算法的可行性。本文的第一章主要介绍了研究背景、研究意义以及国内外研究现状等信息。第二章主要介绍了主流的推荐技术,如基于内容的推荐技术TF-IDF推荐算法,重点详细介绍了各种协同过滤推荐的思路,基于项目的协同过滤、基于用户的协同过滤和基于模型的协同过滤,同时介绍了算法的各种评价指标。第三章对聚类问题和聚类算法的思路进行了介绍,详细介绍了模糊均值聚类算法的思路,并提出了一种聚类算法的改进思路。第四章主要提出了一种新的推荐算法思路。利用第三章的聚类思路,实现对一种基于图模型的协同过滤推荐算法进行了改进。通过将系统中的所用项目看做关联图中的节点,并将同时对两个项目均有评分的用户数设定为其对应的节点间的权值,实现基于图模型的协同过滤推荐。第五章针对图书借阅数据中的评分数据缺失问题,提出了一种基于借阅时长的评分转化公式,并利用第四章的协同过滤算法实现对图书资源的推荐