基于动态语义注意力的指代消解方法

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:qiaozhang781209
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]针对先行表述复杂、指代词语义不明的问题,探索更有效的指代消解方法.[方法]采用端到端的框架,使用打分排序法识别指代关系.先对文本段中的连续词序列进行“提及”打分,判断是否为“提及”;然后利用筛选出的候选“提及”对指代关系打分.其中词序列建模采用动态语义注意力机制,引入更匹配当前指代关系的外部词语义,并使用内部注意力编码,突出先行表述中与指代词关联的部分;综合两部分打分排序得到识别结果.[结果]在基于OntoNotes5.0语料库的CoNLL-2012共享任务英语数据上进行实验,同参数情况下,准确率、召回率、F1值分别比基准模型提高2.02%、0.42%、1.14%.[局限]外部语义表征的来源语料不够丰富,有待补充.训练语料皆为新闻、脱口秀或者网络日志等通用文本,可考虑加入科技文献语料,构造更为丰富的指代情境,并评估模型在各种指代情境下的表现.[结论]动态语义注意力模块可在构建词序列表示时注入更有利于当前指代关系识别的语义特征,动态的、有选择性的外部语义注入更有利于指代关系的识别.
其他文献
[目的]将同一篇引文文献的不同表达形式进行归一,实现期刊引文数据规范控制与管理,减轻引文失范造成的数据质量问题.[方法]以期刊引文数据库建设为目标场景,根据参考文献著录
[目的]减少文本数据的训练数据量,缩短模型训练时间.[方法]基于协方差估计,提出一种新的过滤式样本选择算法,并将数据的遗忘性研究成果应用到嵌入式样本选择算法中.[结果]在
[目的]理清网络在线信任影响因素,洞察信任者与被信任者需求,发掘内外部环境的影响差异,解释各影响因子的作用效应,精准提升用户信任度.[文献范围]在Web of Science、CNKI等
[目的]在文献层和词汇层之间加入主题层,研究一种新的词汇相似度计算方法.[方法]阐述基于形式概念分析(FCA)的主题定义和表示模型,将词汇项映射到主题层级,提出一种基于主题