论文部分内容阅读
语义分析一直是国内外研究者关注的热点,让机器从文本表示中直接获取精确的语义是目前亟待解决的问题。汉语框架识别任务作为国家基金“汉语篇章框架语义关系抽取及其语义推理”项目的子任务之一,主要目标是根据语句中给定的目标词及上下文语境,为其选择合适的框架。该任务以“框架”为桥梁,借助汉语框架网丰富的语义表征能力,将浅层的文本表示映射到深层的语义空间,为实现深层语义分析提供一种新的有效途径。主要研究内容及成果如下: (1)针对特征数目庞大,选取困难的问题,提出了基于双向 GRU 网络的框架识别模型。利用深度神经网络自动学习特征的能力,得到语句的相关语义特征,并避免了因使用分词,词性标注,句法分析等处理工具,造成的误差累积。 (2)针对信息采集粒度较粗,无法细致地刻画语句的语义信息,提出了基于注意力机制的框架识别模型。借助注意力机制,获取语句中词级别的语义信息,进一步提高了模型识别准确率。 (3)针对资源库中框架数目多、各框架下语料不平衡的问题,提出了基于 e-GRU的框架识别模型。利用集成学习的思想,使模型可以适用于工程实践中,为后续研究奠定了基础。 (4)针对歧义词元语料规模较小的问题,提出了适用于小规模语料的基于词分布式表征框架识别模型。利用词的分布式表征,进行框架识别任务。从而避免了人工选择特征,有效地缓解了特征维度过高以及特征间无关联等问题。 本文将语句映射到框架语义空间中,为语义表示提供了一种新的方式,为后续的语义分析研究及具体的应用领域提供有用的语义信息。