论文部分内容阅读
随着互联网以及大数据技术应用越来越广泛,人们不仅获取到海量数据,同时生活方式也发生了极大的改变,其中网购成为一种必不可少的购物方式。为了提供给用户良好的购物体验,推荐系统扮演着不可或缺的角色。最具代表的是协同过滤推荐算法,该算法模型简单,在业界被广泛使用。但该算法存在冷启动和数据稀疏问题,同时缺乏对数据语义信息的描述,无法实现对用户和商品的精准刻画,实现精准推荐难度较大。知识图谱作为一种海量知识的表征形式,旨在描述真实世界中存在的各种实体和概念。知识图谱是一种语义网络,可以融合多种数据源丰富语义信息,并结合推理得到的隐含信息为用户提供服务。知识图谱作为一种新的知识储备已被广泛应用,更被广泛应用于推荐系统。本文进行基于知识图谱的汽车交易智能推荐系统研究。以汽车交易系统为应用背景,通过实体和关系抽取构建领域知识图谱,并建立高覆盖率的实体、概念及语义信息,最后将传统的协同过滤算法与知识图谱相融合,实现汽车交易的智能推荐。本文研究工作有以下几个部分:(1)对基于网站网页数据的知识抽取方法进行研究,并构建领域知识图谱。基于SVM方法对网页数据进行实体抽取,基于Bootstrap对网页数据进行关系抽取,并以汽车网站中的交易数据为例,验证了抽取方法的有效性,并将抽取后的知识图谱存储于图数据库Neo4j。(2)在构建好的领域知识图谱基础上,进行知识图谱的物品语义表示。本文使用翻译模型将汽车知识图谱向量化,并给出评分函数训练模型。翻译模型将构建好的知识图谱嵌入到低维连续向量空间,同时完整保留知识图谱的语义信息,为接下来的推荐系统提供了数据分析保障。(3)将传统的协同过滤算法与知识图谱分析工具相融合,利用知识图谱包含的丰富的语义信息作为对协同过滤算法的有效补充。实验结果表明,融合后极大改善了传统协同过滤推荐算法的性能。