基于依存特征的汉语框架语义角色自动标注

来源 :山西大学 | 被引量 : 2次 | 上传用户:qijich
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对汉语框架语义角色自动标注的研究是来源于国家自然科学基金项目“汉语框架语义依存图自动抽取关键技术研究(No.60970053)”。该项目的汉语框架语义依存图自动抽取是实现汉语句子语义分析的一种新途径,因此汉语框架语义角色标注对实现汉语框架语义分析具有重要的意义。目前语义角色标注的研究大多基于统计机器学习模型,研究表明制约语义角色标注性能的主要因素为统计机器学习中的特征选择问题。本文基于汉语框架网,针对特征选取问题,利用树条件随机场(Tree Conditional Random Fields, T-CRF)模型,研究了基于依存特征的汉语框架语义角色标注。主要研究内容包括:(1)研究了基于词、词性及其组合特征的基线框架语义角色标注模型。其中选取词、词性及其组合为基本特征,按照窗口大小不同构建了3种基线特征模板,最终基线模型在“发明”、“查看”、“拥有”框架下的最优F值分别为:55.36%,52.26%,66.19%。(2)研究了基于依存特征的汉语框架语义角色标注模型。在基础特征的基础上,加入当前节点的依存父子节点、父子依存关系及其组合特征,并依据特征组合及窗口大小不同构建了21种扩展特征模板,最终在“发明”“查看”“拥有”框架下获得的最优F值分别为:58.30%,55.29%,67.24%。(3)研究了汉语框架语义角色标注中的特征贡献情况。实验结果显示,在词、词性及其组合特征的基础上融入依存句法层面的特征,能够提升汉语框架语义角色标注的F值;进一步比较了依存特征对不同长度框架语义角色的标注影响,发现依存特征对较长框架语义角色标注的结果较好,这其中子节点比父节点特征更为重要,依存关系比依存节点更为重要。本文的主要贡献在于全面研究了依存句法特征中的父子节点、父子依存关系及其组合特征对汉语框架语义角色标注的作用,这些结论都将为进一步面向大规模、开放式的汉语框架语义角色标注研究提供了重要的特征选择依据。
其他文献
软件复用是解决软件危机,提高软件生产效率和质量的现实可行的技术。领域工程是可复用资源基础设施建设的主要技术手段。领域分析是领域工程的前期阶段,是获取领域需求规约的关
由于图数据量的增长在图上计算提取知识变得越来越具有挑战性。现在的图数据集变的非常巨大,如FaceBook、twitter、人人网等的数据。传统的图处理工具难以完成这些计算。急需
无线接入的移动网络和宽带网络是网络的两个重要发展方向,而把两者结合起来,实现移动的宽带网络,更是通信领域研究的热点.该文首先介绍了无线ATM(Wireless Asynchronous Tran
特定目标的识别技术是模式识别领域非常活跃的研究课题,在矿产资源的探测,气象云图分析天气预报,复杂背景下军事目标的自动识别等方面都有着广泛的应用。本文主要研究了对于特定
计算机免疫技术是模仿生物免疫机理,完成分布计算环境下免疫检测、免疫稳定、免疫应答、免疫调节功能的计算机安全技术。 本文对计算机免疫系统GECISM(GEneral Computer Im
XML以其强大的数据表达能力,事实上已经成为Internet上数据表示和交换的标准.有些XML数据只能以数据流的形式访问.所以,如何设计XML数据流查询算法,如何利用XML的文档结构来
CIMS工程的推广对于我国大中型制造业的转化机制、深化改革、增强竞争力有重大而深远的影响。MRPII是西方制造业的精华,也是我国CIMS工程的主体,然而由于MRPII内在逻辑上的局
本文基于主动网络技术设计并实现了一种可编程移动IP网络体系结构,设计了可编程移动IP网络的服务创建模型和网络中主动结点的逻辑结构和软件结构。为了满足移动IP的需要,对主动
随着网络应用范围的不断扩大,对网络的各类攻击与破坏也与日俱增。网络安全已经成为国防安全的重要组成部分,同时也是国家网络经济发展的关键。 对入侵攻击的检测与防范,保障
泥水界面检测仪是一种用于测量沉淀池底部污泥积累厚度的电子仪器。它可以使工作人员在任何时候能清楚地掌握自来水厂沉淀池池底的污泥量,准确有效地执行排泥操作,可为水厂带来