同义词挖掘及其在概念信息检索系统中的应用研究

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:ufo747
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的飞速发展,Internet的应用深入到各行各业,Internet上的信息变得繁杂,信息的查找与获取也就变得越来越困难,如何从这个浩瀚的信息资源库中获取用户需要的信息,是人们面临的一个重要问题。传统的信息检索服务已不能满足用户的检索需求,因此智能信息检索成为重要的研究课题。概念检索是实现智能信息检索的重要方式之一。本文研究了搜索引擎特别是中文搜索引擎的相关现状,以及下一代智能搜索引擎即基于概念的检索系统的功能特点,并利用《同义词词林》作为语义体系实现了基于《同义词词林》的同义词扩展检索。并对同义词识别的算法进行了深入的研究,利用基于语义体系的相似度算法实现智能搜索引擎中的同义概念的识别,和相关词语的联想搜索。关键词检索是大多数搜索引擎的主要检索手段,然而多数搜索引擎对此不加控制。从情报语言学研究的成果以及网络信息检索的现状来看,自然语言不加以控制,检索效率与效果是不能尽如人意的。应该说,要克服关键词检索系统的弊病,必须对关键词进行有效的控制,变字面检索为概念检索。本文在分析目前概念检索系统的基础上,提出了基于同义词(概念)挖掘的概念检索系统。同义词的自动发现和识别在基于概念的信息检索领域有着重要的研究意义和应用价值,本文对国内和国外同义词识别算法进行研究和分析的基础上,对基于语义体系的同义词识别算法,即基于《同义词词林》的同义词识别算法和基于《知网》的同义词识别算法进行了深入的研究,利用词汇间的语义相似度度量来进行同义词识别,挖掘出大量的复合词形的同义词。基于《同义词词林》的同义词识别算法的实验结果表明,该算法具有较高的识别率。同义词的自动发现和识别,可以用于扩充同义词词典,提高同义词扩展检索的检准率和检全率。本文还在基于《知网》的词汇语义相似度算法的基础上提出了词语相关度计算方法,从而实现了相关概念联想功能。
其他文献
组织文化与工作满意度都是当前管理心理学研究领域中的热点问题。本研究旨在了解高校教师工作满意与高校组织文化的现状,探讨不同个人背景的高校教师工作满意度及其对组织文
目的:探讨术中超声在冷循环射频治疗肝脏肿瘤中的应用价值。材料和方法:对31例肝癌患者在开腹手术时行术中超声检查,并以超声作为射频针穿刺的引导手段,动态观察手术进程。结
本研究利用自编的“大学教师工作满意度问卷”对武汉、郑州两市的228名大学教师进行了问卷调查,得到了我国部分大学教师工作满意度的结构和影响因素。 研究结果如下: (
一个传统的民族节日往往有其内部构成规律和特定的文化意蕴,它体现了人与自然界气脉相通、生息与共的自然节律,又是人们生活体验和生命精神表达的集中场所。 我国中元节有
池边庭院觅蹊踪,树茂系根枝叶浓。不与群花争艳丽,秋风霜露伴菊红。
在犯罪构成的主体要件和共同犯罪理论中,身份一直都是备受学者关注的问题之一,但是有关身份犯的概念、种类以及身份犯的共犯等问题,理论界和实务界争论颇多。笔者通过对中外
<正>10月26日,陕建集团和知名民营企业陕西亿杰控股集团在内蒙古阿拉善成功签约,以51%的股权控股内蒙古最大花岗岩矿山,标志着该集团向产业链上下游延伸又迈出重要一步。近年
在理论上分析、计算离子交换树脂的交换终点 ,结合真实测定值 ,确定以电导率为指标的交换终点的控制值 .以电导率控制交换终点比pH值更准确 In theory, calculate the excha
大学阶段是大学生社会化的关键时期,而学校物质文化是大学生社会化的一个很重要的中介因素。学校物质文化是学校文化的一个重要组成部分,也是学校文化存在和发展的基础,它对
本文在分析新疆生产建设兵团概况的基础上,从旅游业基本要素竞争力,旅游市场竞争力,旅游关联产业竞争力,旅游管理水平竞争力,自然环境竞争力考虑,构建了兵团旅游产业竞争力的