基于本体的语义全文检索系统的研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:neithernor86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速发展,如何从海量信息资源中准确快速地检索到有利用价值的信息,成为了信息检索领域的研究重点。虽然传统的全文检索技术可以快速地完成对海量信息的检索,但是由于其检索时主要依赖于关键词的匹配技术,仅能从字面上完成检索请求与索引的匹配,缺乏对检索请求的语义层面的理解与分析处理能力,其检索结果不是遗漏重要信息,就是包含大量不相关信息。本体对信息资源进行了有效的组织与描述,本体中概念词之间以关系相连,通过其概念与关系的组合可以完成本体的逻辑推理工作。将本体技术引入到全文检索系统中,利用本体的逻辑推理能力,来实现对检索请求的语义支持,可以很大程度上提高传统的全文检索系统的检索准确性和对无用信息的过滤能力。本文在基于本体的语义全文检索系统的研究中做了以下工作:(1)在深入研究本体及其概念语义相似度的基础上,分析总结了目前概念语义相似度计算中存在的问题。提出了一种基于主成分分析(PCA)的综合加权概念语义相似度计算方法,该方法不仅集成了传统的基于语义距离的算法与基于信息内容的算法,而且引入了深度、密度因子和语义重合度来进行综合的分析,并针对综合算法中权值难以确定的问题,引入主成分分析的思想改进权值分配方法。通过实验证明,基于主成分分析的综合加权概念语义相似度计算方法有效改善了概念语义相似度计算的准确性。(2)利用Jena软件包设计并实现了一个通用的对本体描述语言文件的解析应用模型。该模型不仅可以根据本体中的概念及概念间的关系来计算出概念间的语义相似度,而且还支持将概念对及其之间的语义相似度导入到关系型数据库的功能。(3)研究了全文检索的过程、框架和其中的核心技术,并重点分析了Lucene.Net全文检索工具包的体系结构。利用Lucene.Net全文检索工具包和本体相关技术,设计了一个基于本体的语义全文检索模型,并给出了各个模块的详细设计。其中重点针对原系统的查询模块与结果反馈模块中,因缺乏对语义的支持而产生的检索结果准确性不高的问题,引入了本体概念语义相似度来对其进行功能的扩展。(4)设计与实现了基于本体的语义全文检索系统,通过具体的查询实例,证明了该系统在查全率与查准率方面优于传统的全文检索系统。
其他文献
在无线通信系统中,系统性能主要受到无线信道的制约。发送信号由无线信道传输到达接收端,接收信号的幅度以及相位都极易产生严重失真,以致不能准确地从接收信号还原出发送信号。
蛙人水下语音通信系统主要用于蛙人与蛙人之间、蛙人与母船或岸基之间的信息交互,其中的语音编码技术是实现语音通信的必要组成部分,为水下语音信息的顺利传输提供保障。针对水
基于自然属性的偏振光导航方法,因在较大范围内难以受到人为因素的干扰和破坏,特别适合弱/无卫星信号的陌生环境下导航,具有重要的研究价值和军事应用前景。本文针对已有的仿生
学位
车辆的分割和跟踪技术是图像处理以及计算机视觉领域的热门课题,该技术实现了对感兴趣目标及其运动轨迹的提取。通过计算车辆的前景区域并进行跟踪完成了运动对象的速度、转
目前,超宽带主要应用于短距离通信,由于受到功率的限制系统性能并不是很理想,将多输入多输出(MIMO)技术应用到超宽带(UWB)中可以很好的改善系统性能,还可以提高频谱利用率并扩大传输
并行组合扩频是由软扩频(M-ary扩频)通信方式为基础演变出的一种高效扩频通信方式。他在保留扩频通信抗干扰,抗多径,保密性能强等诸多优点的同时比普通直扩通信模式有着更高的传
在现代电子战中,线性调频(LFM)信号因具有大带宽与大时宽,在雷达目标探测中呈现出在距离与速度上的高分辨率性能。因此,能够有效、高精度的实现线性调频信号的参数估计对实现
高效视频编码HEVC/H.265是到目前为止的新一代视频码标准,它的提出是为了应对当今高清视频的普及给传统视频编码标准带来的挑战与压力。HEVC标准的终极目标是在保证和H.264/A
现在计算机技术和通信技术都在飞速的发展着,同时大大加速了互联网的扩张,一方面对整个人类社会的进步和发展做出了突出的贡献;另一方面伴随互联网的发展和大范围的应用也出现了