基于渡越矩阵与语境计算模型的复句关系词的自动标注

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:limida
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言理解是人工智能领域的经典难题,目前国内外有大量的研究。在汉语信息处理领域,相应的研究应该包括有字处理、词处理、句处理、篇章处理。然而到目前为止,关于汉语理解的研究基础比较薄弱,汉语信息处理的研究基本上还停留在“字和词处理”阶段,大多数研究成果都是基于字和词的研究。对于句子的研究尤其是汉语复句的计算机处理相对要少一些。这可能与汉语的难度有关,因为汉语与西方语言不同,它语法和语义都很灵活,没有形态。汉语的句子从结构上可以划分为单句和复句两大类,复句的意义容量比一般单句大,常表示人和人、事和事及人与物的逻辑意义关系。复句一般由分句构成,各分句单独从其结构上看实际上就是小句。复句本身有其复杂且特殊的结构,复句是小句的联结,作为一种语法实体,它下连小句,上连篇章,在单句和篇章之间起到了一个很好的衔接作用,同时兼有语法、语义和语用等多方面的属性。复句的层次关系从某种意义上来说就是复句的灵魂,复句关系词的标识对复句的层次关系起着重要的作用,随着对复句研究的深入,复句关系词的作用显得越来越重要,如何有效地对复句关系词进行标注就显得迫切和重要。本文首先介绍了关于复句领域的一些相关概念和知识,接着介绍了复句关系词的相关知识,并介绍了标注复句关系词的基于规则的方法,基于概率统计的渡越矩阵方法和基于语境计算模型的复句关系词的标注方法。综合利用这些方法能够对汉语中复句关系词进行有效的标注。
其他文献
随着Internet的飞速发展,从IPv4向IPv6过渡是必然的趋势,在相当长的时间内,IPv4将与IPv6共存。IPv6为互联网发展带来的巨大的挑战和机遇,因为IPv6协议不是完全向下兼容的,必然导致
随着水利工程及岩石工程的建设和发展,岩石内部裂隙的各种科学研究越来越重要。而利用计算机进行岩石内部裂隙的三维形态的重建可以直观有效地展示岩石内部结构将帮助其他科
集控式机器人足球比赛系统分为视觉子系统、决策子系统、通讯子系统和足球机器人小车子系统四个部分,其中小车子系统的性能直接决定着足球机器人在赛场上的表现。本文通过分析
数据库系统担负着对数据信息访问控制和存储的任务,数据库不安全的主要原因之一是原始数据以明文可读形式存放在数据库中,如果对数据库中的数据进行加密处理,那么上述问题可以得
长久以来,人们就想制造出一种具有智能的机器,它能通过自然语言与人类交流并服务于人类。计算机的出现和迅速发展为这个梦想的实现带来了希望。因此,人们迫切地需要计算机具有理
随着网络规模和网络用户的快速增长,理解用户对网络的浏览模式变得越来越重要,因为其对于网络结构的优化、站点的重构,个性化服务和推荐的产生等具有重要的意义。 在实际情况
2000年,Ahlswede等人基于网络信息流的概念提出了网络编码的思想。通过允许网络节点进行编码,可以获得网络组播速率的最大流限,即网络资源利用的理论上限,而通过传统的路由和复制
液晶显示器LCD(Liquid Crystal Display)现在已经广泛应用于手机、 PDA(Personal Digital Assistant)等便携式电子产品中。LCD控制器则是系统和LCD之间的接口部件,是系统显示
平台化是管理软件的发展趋势。传统的管理系统是在低层的技术平台上直接构建的,采用面向技术、业务无关的“原始”编程工具进行开发,这直接导致了所开发的管理系统具有两个重大
随着计算机和通信技术的不断发展,嵌入式系统的应用日益广泛,但传统的开发方法限制了软件开发人员,因为软件的调试,需要在真实的目标系统上完成。为了解决这个软件开发的瓶颈,全系