基于支持向量机的英语情态动词Will语义排歧研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户：eg

【摘要】

：

语义排歧是指根据目标词出现的上下文语境自动识别其意义。语义排歧是机器翻译、信息检索、语音识别、文本分类以及人机交互等诸多领域中的关键环节,是自然语言处理领域的热

【作者】

：

黄亮

【出处】

：

燕山大学

【发表日期】

：

2010年期

【关键词】

：

情态动词will 语义排歧支持向量机人工神经网络特征提取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语义排歧是指根据目标词出现的上下文语境自动识别其意义。语义排歧是机器翻译、信息检索、语音识别、文本分类以及人机交互等诸多领域中的关键环节,是自然语言处理领域的热点和难点。尽管语义排歧技术取得了很大发展,但目前的语义排歧研究对象还是主要集中在普通动词和名词的语义排岐上。情态表达说话人的态度和意见,主要由情态动词来实现。因此,正确识别情态动词的语义对理解和领会说话人的态度和意见十分重要。情态动词语义有三种不确定性:梯度,歧义和融合。这些不确定性使人们很难把握其准确意义。因此,建立一个有效的、准确性较高的情态动词语义排歧模型变得至关重要。本研究基于120万字的语料库,从will的实际使用语境中提取八个语义特征和句法特征,并采用数据挖掘中的一种新方法——支持向量机,建立了情态动词will的语义排歧模型。实验结果显示,由支持向量机方法建立的情态动词will的语义排歧模型的排歧精度达到了98.33%。这个结果,证实了采用支持向量机对情态动词will语义排歧的有效性,同时证明了从真实的语料库中提取的8个语言特征的有效性。为了验证支持向量机语义排歧效果的优越性,本文采用神经网络技术中的反向传播神经网络,径向基神经网络和概率神经网络方法,分别建立了情态动词will的语义排歧模型。对以上四个排歧模型的训练和检验结果对比分析发现,由支持向量机建立的情态动词will的语义排歧模型的泛化能力在实际应用中比人工神经网络技术的泛化能力要更加稳定和可靠。由概率神经网络建立的语义排歧模型的泛化能力要优于径向基神经网络和反向传播神经网络。径向基神经网络的泛化能力又优于反向传播神经网络。另外,本文对情态动词will语义排歧中出现错误排岐的原因进行了分析。在此基础上,确定了不同语言特征对情态动词will的语义排歧效果的影响程度。在原来的模型中先后删除语义信息特征和句法信息特征,建立模型,训练和检验,并将检验结果与原模型的检验结果对比。实验结果表明,语义信息特征对情态动词语义排歧效果影响大于句法信息特征的影响。其中,情态动词will与其后的动词的互信息特征对排歧效果的影响程度最大。通过采用特征提取算法,F-score算法,得出根意义的will与其后的动词的互信息、认知意义的will与其后的动词的互信息、第三人称以及第一人称是影响情态动词will的语义排歧效果的最重要的四个特征。经实验证明,其算法得出的结果是可靠的。情态动词will语义排歧模型的成功建立,不仅有助于实现语料库的自动语义标注,减轻研究人员的劳动负担,而且有助于提高机器翻译的质量。从语料库中提取的识别情态动词will语义的八个有效语言特征,为判断和识别情态动词will的语义提供了客观依据。

其他文献

用于板坯连铸的液芯大压下铸轧机轧辊的开发

介绍了板坯连续铸轧机核心装备——铸轧辊的研究开发。通过数值模拟方法分析了铸轧辊工作时的温度场和应力应变状态等,据此对铸轧辊的结构和冷却方式进行了优化设计;结合理论

会议

液芯大压下铸轧辊数值模拟轧辊冷却堆焊

马克思主义视域中消费社会人的需要的发展

人的需要是一个历史的范畴,处于不断发展变化之中,从生产社会到消费社会,人的需要产生的实践基础发生了根本性的变化,从需要产生的不同层面审视消费社会人的需要发展,生活需

期刊

马克思主义消费社会人的需要发展

泸州地区市民对网络负性信息的认知调查

调查泸州地区市民对网络负性信息的认知情况并分析其影响因素。方法:采用多阶段(整群-分层-随机)抽样方法,自制调查问卷,调查泸州市民1224名,并对结果进行分析。结果:94.9%的

期刊

泸州市民网络负面信息认知

接受理论与旅游推介文本的英译

中国旅游业发展十分迅速,国际化进程不断推进,但旅游推介文本的翻译质量却不尽如人意。事实上,中国旅游推介的英译文本在语言、文化、信息、政治意识形态和语用视角等方面均

学位

接受理论旅游推介文本翻译期待视野读者关照

腹部X线、螺旋CT及超声对肠梗阻的价值

目的探讨腹部X线、螺旋CT及超声等三种检查方法对肠梗阻的诊断效果。方法对肠梗阻手术治疗的128例患者分别进行术前腹部X线、螺旋CT及超声检查,比较三种检查方法的术前诊断准

期刊

肠梗阻腹部X线体层摄影术X线计算机超声检查

湖南谷雨戏剧文学社创作研究

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

谷雨社戏剧舞台艺术创作

头孢他啶致白细胞升高1例

1临床资料患者46岁女性,因间断咳嗽、咳痰1年余,加重伴气喘10余天,意识模糊2 d于2011年12月31日入我院重症医学科。入院查体:T36.5℃P112次/min R22次/min BP142/65 mmHg,SpO

期刊

头孢他啶白细胞升高不良反应

汉学家的中国古史画卷

《史记》是中国西汉时期的历史学家司马迁撰写的史学名著,对后世史学和文学的发展都产生了深远影响,具有很高的研究价值,已被翻译成多种语言在世界范围内流传。但由于《史记

学位

《史记》华兹生文化差异翻译策略文本分析

基于支持向量机的英语情态动词Will语义排歧研究

其他学术论文