语义电子病历数据SPARQL查询优化机制

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:wjsxyxjc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0应用和SemanticWeb研究的成熟,语义电子病历信息的查询在医学科学和信息科学领域里发展成为热点问题。在研究中,学者们抽象出各种病历信息并将其存储为语义网的RDF三元组形式,但随着语义电子病历的发展,数据量呈爆炸式增长,由此引发了大数据的查询效率问题。本文针对语义电子病历大数据的查询效率问题,设计实现了一个部署在CUDA平台上对语义电子病历数据的SPARQL(Simple Protocol and RDF Query Language,SparQL协议和RDF查询语言)查询。其主要功能是通过并行化的SPARQL连续查询来提高语义电子病历数据的查询速度。本文使用了SPARQL并行连续查询策略(Paralleling Continuous-SPARQL)。该策略包含三个核心部分:a.利用CUDA计算的高效特征,将SPARQL的并行计算部分在CUDA平台上实现;b.为了充分利用硬件,以提高查询的效率,本文优化了SPARQL查询方法使其实现了连续查询;c.通过Java自带的JNI接口实现用Java语言编写的SPARQL查询和用C语言编写的CUDA平台库的连接。这样,通过JNI在SPARQL查询和CUDA平台之间建立通道,可以快速地传送和接收数据。本文通过将SPARQL查询和基于CUDA平台的SPARQL连续查询进行对比后的结果是:当数据量在一定的范围内时,基于CUDA平台的SPARQL连续查询比SPARQL查询效率高,且加速比呈上升趋势。
其他文献
在图像处理技术中,细胞图像的分割与提取技术是的最为关键技术,,如何使得分割的效果精确也是人们一直以来研究的重点。由于图像之间存在差异性,它们有各自的特点,在实际的应
随着国民经济的迅速发展,我国汽车的数量迅速增加,致使公路交通的负担越来越重。智能交通系统(Intelligent Transportation System, ITS)可以科学、高效地利用好现有交通基础
随着计算机性能的大幅度提高,人们对计算机的要求也不断扩大。计算机获得外部信息主要依靠计算机视觉,运动目标的检测与跟踪是计算机视觉中最热门的研究课题之一。只有先将背景
结合我国统一坚强的智能电网建设需求,为应对电力信息化建设可能出现的海量数据,寻找行之有效的并行且弹性的数据处理技术是解决该问题的关键所在。MapReduce是由Google提出的基于大规模集群的分布式计算框架。Hadoop是Apache开源基金会开发的分布式系统的基础架构,包含MapReduce和HDFS。其良好的扩展性能和简单易用的操作特点,使之成为云计算的主流平台。本文进行基于MapReduc
嵌入式系统的三个基本特征:资源紧凑有限、时间约束严格、成本极度敏感,并且嵌入式软件本身由于需要处理大量中断,许多嵌入式软件性能指标(系统吞吐量、任务处理能力、堆栈深
近年来,随着我国经济的迅猛发展,企业信息化进程不断推进,作为我国经济建设基石的中小企业的信息化建设越来越引起业界的重视。然而,由于中小企业普遍存在着经济实力弱、个性
人脸识别就是利用计算机技术,通过对人脸图像的分析,提取我们所需要的一些特征信息,用来做身份识别或者目标追踪。它主要有三个步骤:人脸检测、特征提取和人脸识别。人脸识别
目前,关于计算机网络系统特性的研究已经成为一个热点,其中对于竞争特性的研究尤其引人关注。关于星形网的运行机理早已介绍。竞争—冲突淘汰(C-CC)存取方式,作为星型局域网
Skyline查询处理是数据库技术领域的一个研究重点和热点,它在多目标决策、数据挖掘和可视化、用户偏好查询等方面有着广阔的应用。Skyline查询输出数据集中不被其它任意数据
在数据库中用已有的算法对那些有噪声的、不完整的海量数据进行分析、提取,从而可以得到潜在的、隐含在海量数据当中的、对数据操作有用的信息和知识过程就被称之为数据挖掘