面向Web数据的知识图谱学习与推理关键技术研究

来源 :西安邮电大学 西安邮电学院 | 被引量 : 8次 | 上传用户:candy0533
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从语义网的概念提出以来,越来越多的开放链接数据和用户生成内容被发布于互联网中,这使得Web数据呈现出结构松散化、内容碎片化、语义复杂化等特征,已不能满足人们对信息快速、准确定位的需求。在结构化、半结构化、非结构化的Web数据规模呈指数型增长的环境下,知识图谱为信息的高效处理提供了智能化的解决方案。知识图谱在实体层面对本体进行了丰富和扩充,因而可被用于描述现实世界的实体及它们之间的语义关系,有助于人与机器更好的进行信息理解与交互操作,同时为人工智能技术的发展提供了重要的数据支撑。然而,除去Web数据规模的增长,Web数据的高速动态化也给知识图谱的更新带来了严峻挑战。例如,在知识图谱规模的扩张过程中,只能使用显式关系将结构化的知识以网络的形式进行组织,使得知识图谱实体间的潜在关系未得到充分挖掘。同时,知识图谱更新明显滞后于Web数据变化速度,使语义搜索的准确度、时效性受到了影响。本文在学习与分析知识图谱补全相关理论技术的基础上,从知识表示学习、知识图谱推理角度开展研究,旨在优化语义搜索系统的性能,提供高效、快速、准确的查询服务。第一,提出一种基于知识图谱语义张量的知识表示学习算法,以“Rescal张量分解”为核心思想,结合使用知识图谱采样技术、主成分分析技术,通过矩阵学习、向量映射、数据降维进行实体知识间关系的链接预测,提高了实体间多元关系预测效率。第二,提出一种基于贝叶斯推理的知识图谱补全方法,使用贝叶斯概率推理理论与RDF蕴含推理规则,联合推理实体节点间的潜在关系,对新增节点与原节点间的关系进行预测,提升了模型潜在因素的挖掘效率及未知关系预测的准确率。第三,设计一种基于领域本体的知识图谱构建方案,通过知识采集、实体关系建立等七个步骤构建了一个图书信息领域知识图谱。第四,以理论研究为基础,设计并实现了一个基于知识图谱学习与推理的原型系统,完成图书领域知识图谱的信息查询及关联信息推送。基于上述研究工作,本文针对多源异质及高度动态化的Web数据对知识图谱构建、更新、补全带来的负面影响,提出一种更加高效、准确的知识图谱学习与推理方法,以便更好地服务于知识检索、优化查询流程、提升用户体验。随着知识图谱技术的不断发展,未来知识图谱学习与推理技术可与机器深度学习、云计算、区块链、大数据、生物基因工程等新领域进行技术融合,发挥重要的社会价值。
其他文献
近几年,随着信息技术的飞速发展及广泛应用,数字化校园技术在国内各高校迅速发展,在实现为广大师生教学、科研、管理、生活服务的同时,也产生了大量的数据信息。对于如此庞大
学位
随着科技的进步,人们在通过各种渠道获取大量空间数据的同时对空间数据应用需求也日益增长,需要处理更大容量的空间数据,更快的数据传输速率和更快的处理速度也是必须的。这
现阶段,图像处理所解决的问题基本都是一些“病态”问题,即对相同目标采样每次得到的结果不同。这种随机性是由信道中存在的随机噪声对信号的影响产生的。如:大气信道、海流信
安全是物联网发展的基础,信任建模和管理是提高安全的手段之一,信任是以域为单位进行管理和评价的,但实际网络中,经常会发生本域找不到合适资源时,进行跨域调度。此时,信任模
智能交通系统中,交通视频中车辆的检测和跟踪一直是倍受重视的一个热点和难点问题,对其进行研究不仅是进一步车辆行为判断的需要,同时也能为智能交通系统提供许多必要的参数信息
树木是自然场景中不可或缺的重要组成元素,它的几何形状和拓扑结构的复杂性,决定了对它建模特别是形状逼真建模方法研究的挑战性。其中树杆作为树木拓扑形状的直接体现者,是树木
随着Web应用的日益广泛和Web开发技术的不断发展,开发者需要一种能够简化开发过程,降低开发难度,提高开发效率的框架。目前在Web开发中人们使用最多的框架大多数都是基于J2EE
在数据挖掘、模式识别、机器学习等研究过程中,特征选择能够选择出代表整个数据集信息的子集。与处理完整的数据集相比,使用特征选择方法可以节省处理时间、提升效率。由于粗
随着以太网技术的不断发展,以太网技术的应用领域正从局域网逐渐走向城域网。由于以太网技术以分组交换为基础,在承载电路业务时,存在一些先天的缺陷,例如:延时、抖动、分组
针对目前车流量检测及预测所存在的一些问题,本文对于常用的多种运动目标的检测方法进行了研究,选择了实时性强,速度较快实用性高的背景差分法作为运动目标的检测方法。对于