养老保险领域本体库构建及应用研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:cyw87325
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前本体已广泛应用于语义网、电子政务、数据挖掘等传统领域,且正逐渐扩展至云计算、物联网等新兴学科中。本体的构建工作是其应用研究的基础工作,但目前尚无统一标准,而人工构建方式存在周期过长的问题。本文以社会养老保险领域为背景,首先重点研究了该领域的本体构建和可视化方法,并给出一种领域本体半自动构建方法。该方法基于手工构建的养老保险领域基础核心本体,辅以领域专家的指导,利用统计和规则相结合的方法从领域词库中抽取现有本体概念的层次和非层次概念,并进行扩充。再借助本体可视化研究成果循环多次扩充,不断丰富本体。接着本文在已构建本体的基础上,设计基于领域本体的文本聚类分析基本流程,并提出概念词组向量模型和高频特征词组向量模型的概念,在将文本转化为传统的VSM向量空间后,进行降维,转化为概念词组向量和高频特征词组向量。本文还给出适用于社保领域的待聚类文本预处理算法和基于概念词组向量模型和高频特征词组向量模型的文本相似度计算算法,来提高文本聚类的效果。本文实验首先以社保领域词库和文本集为测试数据,实验结果表明给出的领域本体构建方法及本体可视化方法充分结合了领域专家指导本体构建的准确性和机器自动化抽取及扩充新概念的高效性;接着以社保审计领域审计方法为实验数据,验证了给出的文本聚类分析方法的有效性。本文给出的方法在实际应用均取得了良好的效果,对其它领域的本体研究也具有一定的借鉴作用。
其他文献
在日益多样化的网络应用需求下,传统网络暴露出越来越多的缺陷,使得以追求高开放、高灵活、高可扩展、高可管控为目的的新一代网络体系架构得到了广泛研究,然而在追求开放、灵活
人脸识别是根据人面部影像中的有效信息进行身份鉴别的一项技术,是生物特征识别领域的重要组成部分。凭借在国防安全、社会公共安全以及各行业中的应用前景,人脸识别的研究近
随着互联网爆炸式的发展,越来越多的人开始使用互联网,并且互联网中信息量变得越来越大,导致网络拥堵日益严重,降低了网络服务质量。另一方面,互联网中充斥的暴力、反社会、色情等
随着计算机技术和网络技术的迅速发展,互联网上共享的文本呈海量趋势增长,包括数字图书馆环境下的大文本和社交媒体文本等。如何有效存储、管理、检索和使用这些文本数据,是摆在
随着多核处理器体系结构的飞速发展,片上多核处理器以其特有的优势成为主流多核处理器架构被广泛应用到服务器、PC机等商品中,对其进行的研究也在不断深入。多核处理器在多任务
本体是共享概念模型明确的形式化的规范说明,自提出以来就成为研究的热点,并在知识工程、信息检索、Web异构信息处理和语义Web等方面得到了广泛的应用。在大规模本体构建的基
自从计算机诞生以来,计算机硬件故障和软件错误就不可避免地伴随着。在云计算环境下计算机硬件和软件环境更为复杂,随着处理机数量的增加,故障发生的概率与恢复难度也会随之增加
传统伤口评估需要临床医师凭借经验对伤口使用毫米尺等工具进行手动测量大小和视觉观察给出伤病级别、感染等伤口状态评估,因其较低效率占用了海量医疗资源。多光谱图像可获
灵敏性分析是研究改变参数的值及其传播过程,考察参数变化对于目标对象所产生的影响,从而对系统参数和结构的重要性进行量化分析,在系统的特性分析和异常特征发现方面有着广泛的
随着计算机网络技术的快速发展以及数据库、数据仓库等数据仓储技术在管理信息系统中日益广泛的应用,互联网上的信息迅猛增长,海量数据不断产生,Web逐渐成为人们进行资源获取与