基于特征的中文名词性谓词语义角色标注研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:cloudzhu429
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为自然语言处理的一个研究重点,语义角色标注(Semantic Role Labeling,简称SRL)是浅层语义分析的一种实现方式,它标注出句子中与谓词(可以是动词或名词等)相关的语义角色,如施事者、受事者、时间、地点等。根据谓词词性的不同,通常可以将现有的SRL分为动词性谓词SRL和名词性谓词SRL。目前,对名词性谓词SRL的研究相对而言较少,仍有一些问题需要解决,如:SRL性能严重依赖于句法分析的性能,同时名词性谓词SRL性能远低于动词性谓词SRL性能等。以上相关问题在中文名词性谓词SRL研究中尤其突出。近年来的研究表明,目前研究SRL的方法主要是集中于基于特征的方法。因此,本文仍采用基于特征的方法,通过提出更丰富和有效的特征集和新颖的研究方法来提高中文名词性谓词SRL性能。本文的研究内容主要包括如下两个方面:1.研究基于短语结构句法分析的中文名词性谓词SRL。在SRL中,相比于动词性谓词,名词性谓词与其角色之间的结构更灵活和复杂。为了更好的捕获这些结构化信息,本文通过对名词性谓词SRL相关特征集的研究,探索了新的特征集,用于中文名词性谓词SRL。并分析了各个特征的贡献度。实验表明,本文提出的中文名词性谓词SRL性能优于其它同类系统。最后,讨论了使用动词性谓词的特征实例来提高名词性谓词SRL的准确率,然而性能的提高并不是很明显。2.研究联合短语和依存句法结构的中文名词性谓词SRL。把传统的基于短语句法结构的特征和基于依存句法结构的特征相结合,应用于中文名词性谓词SRL。相比于传统单一的短语句法特征,本文联合短语和依存句法结构所选取的特征更加丰富。另外,还讨论了这两种句法结构之间信息的互补作用。实验表明,中文名词性谓词SRL性能得到了提高。本文的主要贡献包括:在基于短语结构的句法分析中,提出了适合中文名词性谓词SRL的特征集;提出了联合短语和依存句法结构的中文名词性谓词SRL。实验表明,这些方法提高了中文名词性谓词SRL的性能,对今后中文名词性谓词SRL的研究具有参考价值。
其他文献
人类对物体的识别主要是对物体外形的识别,图像形状检测在图像处理及模式识别中是很重要的。Hough变换是种在图形图像处理中经常用到的形状检测方法,实现的是一种从图像空间到
近年来,P2P技术成为人们研究的热点问题,基于其分布式和能充分利用资源的特点快速发展并得到广泛应用。但是,随之产生的安全、效率等方面的问题逐渐凸现,特别是网络中节点的
模型驱动架构(MDA)是一种以模型为核心的软件开发方法。MDA开发过程以需求分析阶段为起点,软件开发人员通过阅读分析非形式化或半形式化的需求规格说明,手工创建平台无关模型(PIM)
协同图形编辑系统支持地域分散的一组设计群体通过网络同步高效地浏览、操作和修改共享的图形文档,而其中全复制结构下协同过程中的一致性维护和语义保持是协同设计相关研究
密码学的分析与设计是两个既相互依存又相互对立的研究方向,分组密码的这种对立统一关系促进了它的快速发展。S盒是诸多分组密码系统中的唯一非线性部件,它提供了香农理论中
Malware detection has become more difficult with the use of compression,polymorphic methods and techniques to detect and disable security sottware. Those andoth
随着信息量剧增,并且需要处理的事务增多,存储相关的数据也成为各行业的中心,例如银行、金融、政府、教育等领域,一旦这些数据损坏,将会造成不可估量的损失。存储区域网络(St
随着人类人口快速增加,城市化进程的加快和工业水平的提高,大气中灰霾污染日趋严重,为了加强对灰霾的监测和治理,开展灰霾等级的预测意义重大。   本文通过将美国环保署开发的
随着网络的发展,因特网成为目前使用最广泛,规模最大的信息源,为了方便、高效的从网络上获取所需要的信息,人们广泛使用搜索引擎来进行信息搜索。然而搜素引擎搜索出来的信息都是
H.264是MPEG和VCEG联合开发的视频压缩编码标准,其性能远远高于早期的MPEG-4和H.263编码,在2003年被ITU-T通过并且在国际上正式颁布。H.264具有高效的编码效率及网络亲和力,