受限域实体语义关系抽取研究

来源 :昆明理工大学 | 被引量 : 1次 | 上传用户:guipian110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实体之间的关系抽取是信息抽取中倍受关注的一个重要的研究方向,也是自然语言领域的热点问题之一。在传统的中文关系抽取中,研究的往往是通用领域实体之间的关系,而在实际应用中,受限域(即特定领域)的实体间关系则更具实用意义。特定领域的实体关系研究与通用领域的实体关系研究的侧重点有明显不同,主要研究对象为具体概念。在旅游领域,有限的导游知识已不能满足客户对旅游知识的了解,旅游领域问答系统的出现,抽取出旅游领域概念、实例、属性和属性值之间的关系就显得尤为重要。本文以旅游领域概念、实例、属性及属性值为研究对象,围绕领域概念-实例、实例-属性值语义关系抽取做了以下几个方面的工作:1.实现了基于CRFs(条件随机场)的概念、实例、属性及属性值四类实体的识别。这是实体语义关系抽取的前提与基础。通过分析四类实体本身的特点以及实体出现在句子结构中的上下文特征,以旅游领域概念、实例、属性和属性值为对象进行实验。2.针对旅游领域概念-实例、实例-属性值语义关系抽取难的问题,采用SVM(支持向量机)模型实现概念-实例、实例-属性值的语义关系抽取。把关系抽取问题看作为分类问题(存在关系或不存在关系),结合SVM在解决小样本分类问题上的优势进行实体语义关系的抽取。3.针对基于SVM的关系抽取方法不能解决复杂句式的语义关系抽取问题,提出了基于Markov逻辑网的实体语义关系抽取。综合利用概念-实例、实例-属性值语义关系的词特征和句子结构特征,通过定义一阶逻辑公式来表示概念-实例、实例-属性值语义关系,借助Markov逻辑网将所有特征融合到Markov网中进行概念-实例、实例-属性值语义关系抽取。实验表明,融入复杂句子结构特征后的实体语义关系抽取较基于SVM的关系抽取效果要好。4.结合以上工作实现了实体语义关系抽取的原型系统。
其他文献
1什么是数字化校园“数字化校园”是以数字化信息和网络为基础,在计算机和网络技术上建立起来的对教学、科研、管理、技术服务、生活服务等校园信息的收集、处理、整合、存储
在新的历史背景下,随着城镇化的深入推进,意味着国家越来越重视城乡的共同发展,在城镇化的实施进程中,城市周边的土地被大量征用,而土地对于农民来说,是生活的命脉,更是农民各项生
一、问题的提出语文是各个年级课时量最大的学科之一。说明了语文学习的重要性,而另一方面,不管对学生还是对老师,这都容易成为一个单调、重复、枯燥的艰巨任务。因此,如何让高强
培养学生的听说读写能力是小学语文教学的重要目的所在,是衡量学生的语文素养和语文课堂教学质量的准绳。它对提高学生思维的流畅性,语言表达的准确性和交流的得体性有很大的作
为了适应信息时代的需要,本刊编辑部从2010年元月1日起正式启用中华医学会远程稿件处理系统,一律不再接受纸质稿件,请广大作者配合和支持。同时,也烦请《中华医学美学美容杂志》审稿专家积极配合本刊编辑部这一举措的实施。届时,广大作者将可以在很短的时间里得到稿件处理情况和稿件最终使用信息,既方便广大作者的投稿,
随着全球可用淡水资源的紧缺,以及水污染的不断加重,污水处理越来越受到人们的关注。为了实现我国经济的可持续性发展,利用污水处理技术实现水的重复利用有重要意义,其中提高污水
有机电致发光器件界面发光与界面改性作为有机电致发光器件界面研究的重要内容受到了研究者的普遍关注。在有机电致发光器件中,界面发光即界面激基复合物和界面电致激基复合