【摘 要】
:
通过W3C(万维网联盟,World Wide Web Consortium)组织及工业界和学术界的不懈努力,语义Web形成了由资源描述框架RDF(Resource Description Framework)为核心的多层体系结构。
论文部分内容阅读
通过W3C(万维网联盟,World Wide Web Consortium)组织及工业界和学术界的不懈努力,语义Web形成了由资源描述框架RDF(Resource Description Framework)为核心的多层体系结构。RDF以一种特定的表达方式,定义了一种可以让计算机理解其数据语义的描述。由于其数据结构有别于传统的关系数据库,也不同于普通的Web网页或文档,这种特殊的数据结构对数据管理提出了诸多新的问题,所以在信息检索方面的应用也越来越受到人们的关注。对RDF图的检索工作,考虑到用户操作的简易性,关键词查询仍是主流查询方式。由于数据结点之间具有复杂的语义关系,数据结点的文字描述篇幅较短,所以无法将传统的关键词检索技术简单地应用到RDF图检索中。否则,不仅会直接导致检索结果严重缺失语义,还会降低检索的查全率(Recall Rate)和查准率(Precision Rate)。针对当前存在的问题,本文从RDF图的结构和丰富的语义特性角度出发,提出并构建了RDF图层次概念索引,同时设计了基于概念索引的RDF图语义检索方法。首先,通过对RDF图的预处理,完成实体结点的概念扩展、实体抽取、层次聚类,进而构建用于语义检索的层次概念索引;然后,将用户的检索条件进行语义扩展,得到一个包含概念、实体、关键词的组合查询条件,同时将概念映射到本文提出的语义空间中,对层次概念索引进行检索,得到初步结果集;接下来进行RDF图的二次查询,将最终结果返回给用户。本文设计了RDF图层次聚类语义检索的整体框架,并实现了一个原型系统。以DBLP中的计算机文献领域数据为数据集对该原型系统进行实验验证,其结果证实了层次聚类语义检索方法的可用性。层次概念索引的构建,缩小了检索范围,提高了查询效率;关键词概念扩展和语义空间的构建丰富了检索结果的语义特性,进而提高了查准率;RDF图的二次检索也使得检索结果的查全率有所提升。
其他文献
在教学管理部门的数据库中,存储了大量的学生各门课程的成绩数据,这些数据中隐藏着许多有价值的重要知识,如何挖掘出这些知识,对学生的学习和教学管理部门的教学管理,具有重
随着Internet的发展及信息的全球化,人们对不同语言的信息需求越来越多。对于大多数不精通外语的用户来说,想要获取需求的信息存在一定的难度。因此有研究者提出了对跨语言信息
随着生物分子序列数据的快速增长及人类基因组计划的实施,生物信息学逐渐发展起来。在生物信息学中,序列比对问题是生物信息学中最基本的也是最重要的问题之一,通过序列比对可以
随着近年来移动计算的快速发展,能耗问题越发地成为移动端图形应用的瓶颈。因此,限制绘制过程所需的能耗已成为新的需求。这篇文章中,我们提出了一个具有实时优化能耗功能的
脑组织图像分割在医学图像分析中具有重要的理论与应用价值。现有的很多图像分割方法都是基于传统统计学理论,是基于样本数趋于无穷大的渐近理论,而对于高维特征、小样本数的问
近年来,随着电子摄影产品的迅速普及,数字图像以惊人的速度涌现在网络上。如何从海量的图像中检索出所需图像成为一个亟待解决的问题。合理的图像标签顺序对图像检索和分析有
数据挖掘(Data Mining)是从存放在数据库、数据仓库或其他信息库中的大量的数据中获取有效的、新颖的、潜在有用的、最终可理解模式的非平凡过程。而关联规则挖掘作为数据挖
因为蛋白质在高温或极端PH值的环境下非常容易失去活性,这就造成了在一些极端环境中进行蛋白质的大规模的生产应用困难的局面,为此,蛋白质在极端条件下的热稳定表象成为了生物物
目前,互联网中越来越多的数据以XML的格式进行传输和操作,XML结构的灵活性使复杂的半结构化数据的交换更加方便。但是,在实际工作中,如传感器噪声数据、信息抽取时包含错误数
高光谱遥感图像具有高维度、高分辨率和高数据量等特点,所带来的问题是信息重叠率高、冗余信息较大、波段间相关性大以及存储数据花费时间较长等。因此,对于涵盖了丰富的卫星遥感成像信息的高光谱图片,选择最有价值的信息显得尤其重要。在整个高光谱图像处理过程中,波段选择成为整个过程的重要环节,也成为了后续处理的必要条件。本文在分析了现有的波段选择算法的基础上,对高光谱溢油图像的波段选择相关技术进行了研究,包括以