论文部分内容阅读
随着互联网的普及和信息技术的发展,网络信息数据呈现爆炸性的增长,信息过载问题随之凸显。为了帮助用户从大量信息中发现自己感兴趣的信息,以及帮助信息生产者让自己生产的信息受到广大用户的关注,推荐系统应运而生。然而,传统的推荐系统面临的稀疏性问题以及冷启动问题在一定程度上限制了推荐系统的效果。本文通过构建一个领域内的知识图谱,并提取其中物品的语意表示,结合协同过滤算法来提高推荐系统的性能。本文以基于知识图谱的推荐技术研究及应用为研究课题,重点研究了领域内知识图谱的构建技术,知识图谱中实体和关系的嵌入方法以及基于知识图谱的推荐算法。本文的主要研究内容如下:本文首先研究了领域知识图谱的构建方法,设计并实现了一种电影领域的知识图谱构建方法。本文将知识图谱概念引入到电影领域,对电影领域知识特征进行分析,实现了领域内实体和关系的划分,完成了电影领域本体库的构建。然后抽取了电影领域的实体和关系,并且完成了基于关系数据库的知识图谱存储。最后分析了关系数据库进行知识存储的利弊,利用Neo4j改进了知识的存储方式。然后本文提出并实现一种电影领域知识图谱中实体和关系的向量化方法。本文给出的知识图谱中的实体和关系的嵌入模型,利用知识表示技术在保留语义信息的基础上,将实体和关系进行向量化表示。此外本文还对原负采样算法进行了改进。实验证明了本文使用的向量化方法是有效的。最后本文提出了一种基于知识图谱的个性化推荐算法。将知识图谱中物品的向量化表示方法和协同过滤算法结合,利用从知识图谱中提取的物品语义信息,弥补基于物品的协同过滤算法没有考虑物品本身内容信息的缺陷。对比基于物品的协同过滤算法,本文提出的基于知识图谱的推荐算法在准确率、召回率和覆盖率方面有一定提升。