论文部分内容阅读
本文从框架理论的角度对汉语文本的框架语义表示进行了研究,旨在探讨基于英语文本的FrameNet框架语义标注方法在汉语中是否同样适用。框架理论是Minsky在人工智能领域提出的一种知识表示方法,Fillmore将它引入到语言学中,逐步发展为框架语义学,并主持了位于美国加州伯克利国际计算机科学研究所(ICSI)的语义工程——伯克利框架网络(Berkeley FrameNet)。其核心是在框架元素、语法功能和短语类型等层面对英语句子进行标注,试图发现核心动词(LU)和它周围各框架元素(FE)之间的搭配关系,从而归纳出知识的语义表示方法,进而集结各框架构成FrameNet网络。在知识表示的研究中,汉语句子的规则探讨和中文语料的标注也有很多成果,但一直未对框架语义进行归纳和标注。是否可以借鉴FrameNet标注方法来表示汉语文本的框架语义知识成为本文的研究问题。伯克利框架语义工程各标注层面上所涉及到的理论支持,从词汇、句法到语义,在汉语中也可以找到相应的研究成果。尤其是近几年基于动词配价的汉语句模构建从语义特征的角度对汉语基本句式作出了概括,综合了句法和语义层面的知识表示,可以作为汉语文本框架语义标注的基础。现有的中文研究与伯克利框架网络渊源相仿、内容相通、实践有同,只是术语上略有差异。从理论上分析,基于英文的FrameNet标注方法在汉语中仍然适用,但需进行与中文特点相适合的变动和语料标注的尝试。为了进一步求证框架语义标注在实践中的可行性,本文从句法、语义、词性、词语类别和类别编号入手,对24个汉语基本动核配置结构进行了可行性验证,并选取了两段文本进行语篇标注。由于现有的汉语句模研究尚在规则探讨阶段,本文以真实语料作为标注对象,不仅从句子层面进行分析,还剖析出作为语篇的文本整体提供给我们的结构信息等内容,在汉语文本知识表示中作出了从句子到篇章的突破。总之,作者在行文中详细介绍了伯克利FrameNet的框架语义学基础及其标注实践,阐述了汉语在词汇、句法和语义各标注层面的已有成果,给出了中文基本动核配置结构的标注实例,并进行了汉语语篇标注的尝试及其框架语义分析。通过理论分析和标注尝试,总结出基于英语的框架语义知识表示方法经过与中文特点相适应的修订后在汉语中同样适用。该研究为汉语文本的框架语义标注提供了一种可以借鉴的方法,并将促进基于标注语料的语言规则研究以及汉语句模的进一步规范。