基于人工神经网络构建英语情态动词may的语义排歧模型

来源 :燕山大学 | 被引量 : 0次 | 上传用户:quickz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
歧义是自然语言中普遍存在的现象,而利用现代计算机技术,根据语义因素、上下文因素、甚至是语言因素之外的常识,来自动确定歧义词在特定环境下的词义就是语义排歧。语义排歧是自然语言处理领域的最棘手的难题之一,其准确率的高低将很大程度决定机器翻译、信息检索、文本分类等自然语言处理的效果。因此语义排歧研究一直都是自然语言处理领域的热点问题,并在知识库的构造、知识获取、特征选择和学习算法方面已经取得了显著进步。然而,虽然排歧方法得到迅速的发展,但排歧的对象却始终限于普通名词和动词,对于像情态动词这样语义更加模糊、对语境更为敏感的词类的语义排歧,目前尚未发现。本质上,语义排歧的研究对象是语言,所以,将语言学领域中对于语言现象和本质的研究结果应用于语义排歧问题,将推动语义排歧向更深度和广度发展。特别是在情态意义方面,语言中的情态研究历史可以追溯至两千多年前的古希腊,尤其是随着上世纪现代语言学的兴起,情态意义研究更是百家争鸣,研究的方法也更新、更系统、更多样化、更贴近语言的实际使用。利用语言学中关于情态动词的研究成果,构建一个英语情态动词的语义排歧模型,在理论上是有可行性的,并且能够将语义排歧从目前对普通名词和动词的表层语义的排歧上升至情态语义的排歧。而从另一方面来说,语义排歧的发展也能在一定程度上服务于语言学研究,如果能够实现情态动词的自动语义排歧,那么在语言学家采用大规模语料库研究情态动词时,每个情态动词的语义可以实现自动标注,这样就能节省很大的时间和精力,提高研究效率。因此,本文的研究结果将对语言学研究具有理论意义和实践指导意义。本文采用自然科学领域已经广泛使用的人工神经网络技术和方法,利用神经网络的自组织、自适应和高容错性等特点,通过对大规模真实语料库的学习,构建了一个针对英语情态动词may的语义排歧模型,该模型最终达到了78%的排歧正确率,达到了比较理想的结果。
其他文献
中国古代文化典籍蕴含丰富的文化信息,具有很高的思想和艺术价值。从不同的角度对这些典籍的英译进行对比分析对于深入挖掘对于语言、翻译、文化等方面的认识有着非常重要的
同志们:大家好!  岁末年初,大家工作都很忙.把大家请来开这个会,就是为了统一思想,明确任务,齐心协力做好2006年教育技术装备工作.明年是“十一五”规划的开局之年,作为基础
覃姓是土家族大姓,主要分布在湖南,湖北、重庆等地.关于土家族覃姓来源,学术界存在多种观点,主要集中为有竹氏后裔说和出自巴人五姓之一的瞫姓,为瞫氏所改.将田野调查和文献
长久以来,人们普遍认为科技论文是一种直接同事实真理交涉,能够完全客观传递信息的文体。但是一篇成功的文章也要做到极力地说服读者以接受文章观点,也就是说,科技论文不但能
牡蛎,咸涩微寒,入肝肾经.<神农本草经>谓其"主伤寒寒热,温疟洒洒,惊愤怒气,除拘缓鼠瘘,女子带下赤白.久服强骨节,杀邪气,延年".现代多认为其既能平肝潜阳,治疗阴虚阳亢引起的
以语言学视角梳理清末民初文学的变化历程与历史形态,具有重审历史与反观文学的双重意义。《分裂与建构》一书将清末民初的文学纳入到语言演变的坐标中,阐释了中国近代文学语言
<正>教室的门锁坏了,一直关不上。今天,风比较大,总是把没锁的门吹开,前排的同学就把门虚掩着,再用一个凳子抵住。下午上课前,大部分同学都坐在教室里自习,我也到了教室陪着
期刊
分裂不定式在英语语法学界被认为是一种极具争议的语法结构。一方面,众多的语法学家严厉的批评和反对其在英语中尤其是英语书面语中的应用,因为分裂不定式是一种不符合文法的
评分不一致是影响评分信度的主要因素。本文通过评分一致性检测来研究大规模网上作文评分的信度。以湖南大学英语分级考试作文测试为研究对象,采用IRT多侧面Rasch模型,通过分
新世纪翻译的繁盛带来了对译文质量评价的迫切需求。传统的译文质量评价方法多是学术性和综合性的,因而操作性不强。本文旨在建立一个实用的针对科技英语译文的质量评价模型