汉语否定与不确定信息识别研究

被引量 : 0次 | 上传用户:l1301wz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言中存在大量否定与不确定信息,针对此类信息的识别是目前信息抽取领域研究热点之一。英文中否定与不确定信息识别研究较早,但目前面向汉语的否定与不确定信息的自动识别研究尚处于起步阶段。其中一个重要原因是汉语否定与不确定语料匮乏,导致相关研究进展缓慢。同时,汉语在语言特征(如语法、修辞等)上与英语存在较大差异,需要提出针对汉语的否定与不确定信息识别模型。本文制定了一套面向汉语的否定与不确定信息标注规则,构建了汉语否定与不确定信息识别语料库,并提出了汉语否定与不确定触发词和覆盖域的识别方法。具体研究内容包括以下三个方面:首先,制定了一套面向汉语的否定与不确定信息标注规则,构建了汉语否定与不确定信息识别语料库,并统计在不同类别文本中否定与不确定使用的语言现象。该语料为汉语否定与不确定信息识别提供了重要资源。其次,分别提出了基于字框架和词框架的汉语否定与不确定触发词识别模型。另外,为了解决触发词歧义问题,本文将基于词框架的条件随机场(conditional randomfields,简称CRF)模型与概率统计模型相结合,提出了新的汉语否定与不确定触发词识别融合模型。实验结果表明,该模型提高了触发词识别性能。最后,借鉴英文中覆盖域识别使用的特征,提出了面向汉语特征的否定与不确定覆盖域识别方法。并在此基础上,提出了基于多分类器的汉语否定与不确定覆盖域识别融合模型。实验结果表明,该模型有效提高了覆盖域识别性能。本文提出了一种汉语否定与不确定触发词和覆盖域识别方法,该方法的研究将进一步推进面向汉语的否定与不确定信息识别研究的发展,为自然语言理解等需要确定语义知识的应用服务。
其他文献
目的:后交通动脉瘤是最常见的颅内动脉瘤之一,更容易破裂出血。既往研究大多涵盖颅内多部位动脉瘤分析破裂的危险因素,不可避免混杂因素的干扰。本文针对后交通动脉瘤从临床与
一直以来贫困就是一个世界性的问题,同样贫困对于我国来说也是一个严峻的挑战,关系着我国全面建设小康社会的目标能否实现,也见证着我国发展成果能否惠及全体人民的政策出发
目的了解南京市中小学生睡眠时间与血压水平之间的关系,为儿童青少年高血压的预防干预提供依据。方法于2013年9月采用多阶段按比例随机整群法抽取南京市48所学校10 091名学生
当前世界,品牌效应正在开始成为各个企业全力塑造的核心企业理念。品牌的趋势提高。品牌观念对传统的市场活动带来了巨大的冲击。各家房地产公司也逐步开始树立和创办自己的
通过农村居民点整理,可以优化农村人居环境,促进土地节约、集约利用,是缓解我国土地供需矛盾,实现耕地占补平衡的有效途径。因此,农村居民点土地整理问题日渐受到关注,成为目
由中国光学学会激光加工专业委员会主办,慕尼黑展览(上海)有限公司承办,通快(中国)有限公司发起,百超(上海)精密机床有限公司,萨瓦尼尼(中国),天田(中国)有限公司,三菱电机自动化(中国)有限公司
21世纪的竞争已不再是企业与企业之间的竞争,而是供应链与供应链之间的竞争。随着农业经营者面临的竞争环境的变化特别是消费者对农产品需求的变化,供应链管理思想也在农业中
计算机仿真实验是计算机应用的一个重要分支.本文将基于Matlab gui设计的波动光学仿真实验平台应用到波动光学的课堂教学中:弥补了现实实验受学时、仪器、空间等条件制约的不
目的:选取人肝癌细胞HepG2和小鼠原代肝细胞以及C57BL/6J小鼠,建立体内外炎症模型,观察在炎症状态下,肝细胞及小鼠肝脏FAT/CD36(fatty acid translocase/CD36)表达及脂质积聚、纤维
我国海水养殖业经历了“四次浪潮”之后,其产量已跃居世界首位。然而,就在我国海水养殖业快速发展的过程中也暴露了一些严重的问题:海洋生物资源的日益枯竭,养殖区环境的急剧