【摘 要】
:
语义角色标注是自然语言理解领域的一项基础技术,通常将语义角色标注问题看作是序列标注问题。目前,解决序列标注问题较为流行的方法是构建基于长短期记忆循环神经网络(Long
论文部分内容阅读
语义角色标注是自然语言理解领域的一项基础技术,通常将语义角色标注问题看作是序列标注问题。目前,解决序列标注问题较为流行的方法是构建基于长短期记忆循环神经网络(Long Short Term Memory,LSTM)模型,该模型可以有效的解决序列文本中长距离信息依赖的问题,且避免了特征的复杂选取任务和对句法分析结果的依赖。本文选择经过改进的双向循环神经网络模型(Bidirectional Long Short Term Memory,BiLSTM)来解决传统机器学习方法存在的缺陷和不足,并选取不同的特征进行实验并分析结果,提出了基于BiLSTM-CRF(Condition Random Field)的语义角色标注模型,设计并实现了基于BiLSTM-CRF的语义角色标注系统。本文在分析了大量相关资料后结合中文宾州树库Chinese Prop Bank(CPB)句法分析结果,给出了语义角色标注领域数据标注的方法,并参考Co NLL国际评测会议的数据对该方法进行改进和完善,将该方法应用于本文语义角色的数据标注中。给出该方法的具体步骤,首先,总结数据中动词所在句子,形成动词文件;然后对语义角色标注领域的每个角色分别单独说明,并举例说明角色所在句子中被标注的类别。构建了基于词边界字向量的BiLSTM语义角色标注模型,并选取词法分析的结果作为其中一个特征,将字与词性特征结合作为组合特征;再利用向量化工具得到词到向量的转换,以此作为该模型的输入数据;同时与基于词和词性结合的实验结果进行对比。对基于BiLSTM词边界字向量的语义角色标注模型继续进行改进和优化,提出了基于BiLSTM-CRF的语义角色标注模型,该模型在基于词边界字向量的基础上,将BiLSTM神经网络结构与CRF结合,并搭建了基于BiLSTM-CRF的语义角色标注系统。由于单独的BiLSTM预测的标签之间是互为独立的,对处理复杂语义关系的句子无能为力。而CRF可以使标签之间携带语义关系,能够计算出标签之间的转移概率,使得下一时刻需要预测的标签可以根据之前时刻的标签来确定,这样能够使预测出来的结果更准确。
其他文献
工业是关系国家发展的支柱产业,优化控制效果、提升生产效率是工业控制的主要目标。在工业控制系统中,模型建立是控制问题的基础,而真实模型参数会随系统运行损耗,噪声干扰等
崔国因,生于太平县甘棠村的一个没落的书香门第之家,自幼接受中国传统文化教育,历官翰林院编修、左庶子,曾任出使美国、日斯巴尼亚(今西班牙)、秘鲁三国大臣。经过多年官场历
研究背景:以细胞膜为基础的纳米系统具有良好的生物相容性及靶向性,在许多治疗应用中得到了广泛的研究。然而,目前的研究主要集中在单细胞膜上,来自不同细胞种类的膜的多功能
传统的地铁车站由于在公共区域设置有大量的结构柱,存在割裂空间、阻挡视线、限制人流等问题,在客流高峰期,这些缺点带来的弊端将愈加明显。而取消结构柱后形成的大跨无柱地铁车站,以其空间通透、视野开阔、人流通畅等优点,近年来逐渐受到大家的青睐并不断地被推广应用,相关的研究成果也较为丰硕,但是对于不同结构型式的无柱地铁车站间的受力特性的对比、在受到车站跨度及埋深等影响因素改变时的力学行为变化规律以及抗震性能
党的十八大以来,我国生态文明建设呈现快速发展的新局面。特色生态小镇作为生态文明建设的一个全新载体开始走进学术研究视野。特色生态小镇是坚持产业、文化、旅游“三位一体”和生产、生活、生态“三态融合”发展的基本原则,在促进人与自然和谐相处、实现人民群众对美好生活期待的基础上,作为我国经济和城镇化发展到一定阶段的必然产物,是破解我国当前经济增长困境的新动能,也是为实现美丽乡村愿景而出现的新载体。本论文围绕
目的:研究间充质干细胞(mesenchymal stem cells,MSC)对经鞘氨醇激酶1(sphigosine kinase 1,SphK1)基因沉默的人结肠癌RKO细胞增殖和迁移的影响,并探讨其可能机制。方法:采用
我国近年来进行了许多公共文化服务的数字化建设探索,然而与当前社会的发展水平和我国国民日益增长的精神文化需求相比,现在的公共文化服务水平仍然有待提升。公共数字文化服
背景:肝癌是人类最常见的恶性肿瘤之一,其死亡率位居全部恶性肿瘤第二位。肝癌的高复发率、易转移和化疗耐药是影响患者长期生存的重要因素。肿瘤干细胞(Cancer Stem Cell,CS
人民政协作为中国人民爱国统一战线的组织、中国共产党领导的多党合作和政治协商的重要机构、我国政治生活中发扬社会主义民主的重要形式,是推进国家治理体系和治理能力现代
在带钢冷轧线上,带钢的纠偏控制是非常重要的环节。稳定精确的对中运行是保证带钢连续生产的前提,因此对带钢纠偏控制的研究具有重要的理论意义和实际应用价值。本文以连轧生