基于Attention-Based BertCNN的文本相似度计算方法研究

来源 :武汉邮电科学研究院 | 被引量 : 2次 | 上传用户:liwuyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本相似关系的判定是自然语言推理的典型任务目标之一,具有十分广泛的实际应用场景,任务的难点在于:如何使模型能准确地理解文本的语义,并准确给出文本对的相似度打分。传统的基于LSTM或CNN结构的模型判定结果可用来表征文本之间的相关性,却难以准确的度量语义层面的相似性。近年来,预训练语言模型BERT的问世,使得自然语言处理领域进入新纪元,本文借助BERT的优势,针对文本相似性计算任务进行了研究与探索。主要成果如下:(1)针对SiameseCNN所使用的静态词向量无法准确表征上下文语义的问题,提出了BertCNN网络,该网络使用BERT基于特征提取的方法,引入预训练语言模型的先验语言知识,来获得准确的、融合语境语义的词向量。(2)针对Siamese网络在编码阶段只提取单句独立特征,而忽略句子对特征的缺点,提出了注意力前置的BertCNN网络,在卷积之前通过可分解注意力机制比较句子对字(词)粒度的相似性,使后续卷积提取句子n-gram特征的同时,提取句子对之间字(词)粒度交互特征。(3)针对平均池化会无差别地对待卷积特征图的问题,提出了注意力后置的BertCNN网络,在卷积之后引入注意机制比较句子对n-gram短语粒度的相似性,用以获取加权平均池化的权重向量。(4)进一步,融合之前几种迭代网络的优点,提出了Attention-Based BertCNN(ABBertCNN)网络,加持BERT的同时,引入两层注意力层,从多粒度、多角度充分提取句子对交互特征,并通过改进池化策略使模型更关注句子间相似的成分。(5)通过对比实验验证了ABBertCNN的有效性,能获得远超ESIM并与BERT微调持平的效果,同时比BERT微调训练更快,对低配硬件更友好;通过消融分析实验验证了加持BERT、加持第一、二次注意力机制的3种优化手段,都对提高模型性能有积极作用。
其他文献
世界各国对制造业的重视,使得数控刀具有了飞速的发展。然而国内刀具自主研发设计核心技术的缺失,使得新型高效刀具的设计与制造面临很大的挑战。掌握数控刀具设计与制造的关
历史文化是人类得以延续发展的重要载体,也是衡量一个民族、一个地区、一座城市乃至一个国家文明程度的重要标志。中国历史文化名城泸县拥有着源远流长、博大精深之历史文化,也创造出璀璨多姿、内涵深厚的非物质文化遗产。泸县地处四川盆地南部,境跨长江、沱江等区域,幅员广阔,是联合国科教文组织公布的世界“千年古县”,也是我国命名的“全国文化先进县”“全国文物先进县”“中国龙文化之乡”“中国龙舞之乡”。泸县境内文化
学位
对称约化理论是分析力学近年来发展的一个重要理论,对称约化是对称性理论的升华.对称约化理论就是利用动力学系统具有的某种对称性及其守恒量对系统进行约化,从而可以将原系
协同分割作为图像分割的分支,是指从多张相互关联的图像中将同个目标或者相似的目标分割出来,获取人类感兴趣的目标。它常被用于目标检测与跟踪、图像检索、图像分类和3D模型
经济全球化之大潮已然汹涌而来,企业发展呈现出集团化趋势,由此带来并购活动的大活跃,并且创新出并购基金这种新的并购手段。我国政府层也陆续出台了相关政策支持并购市场的发展。现在,有着极多的上市公司为了达到并购的目的,都纷纷选择同私募股权投资机构合作设立一只并购基金对目标公司进行控制,本文以柳州制药为例,整理了这方面的相关理论,阐述了并购的相关概念、组织形式和结构设计本文以并购基金为研究对象,探讨了上市
自Gabor提出信号可由基本函数分解以来,广大学者投身于基和框架的研究中,框架中的一类Gabor框架进一步推动了框架理论的发展。本文主要讨论了Gabor框架的问题,框架是标准正交
我国常规蛋白质饲料资源短缺,因此可通过提高植物源原料的消化利用率,优化羽毛资源的处理工艺,在一定程度上缓解蛋白质资源短缺问题。本实验室的二硫键还原酶分离提纯于地衣芽胞杆菌CP-16,经枯草芽孢杆菌WB600异源表达,具有广泛pH和温度适应性的高还原二硫键活性的蛋白酶,可对原料蛋白的二硫键结构进行破坏,具有巨大的肠道添加剂应用潜质。但畜禽的消化过程是多酶协同处理的过程,因此本试验深入研究二硫键还原酶
在本文中,我们研究如下一类四阶抛物方程问题{ut+△(∣△u∣p-2△u)=-div(∣▽u∣q-2▽ulog∣▽u∣),x∈Ω,t>0,u(x,t)=△u(x,t)=0,x∈Ω,f>0,u(x,0)=u0(x),x∈Ω,这里Ω Rn 是一个有界区域,且具有光滑边界Ω,pq是常数且有2<p<q<p(1+2/n+2),u0∈(W1,po(Ω)∩W2,P(Ω))/{O}.
本文运用丙烯腈-丁二烯-苯乙烯(acrylonitrile butadiene styrene,ABS)铸型技术,制作44例牦牛(Bos grunniens)肾内管道铸型标本,通过对标本的观察研究,旨在明确牦牛肾内动脉的分支和分布特点,以及肾集合系统的解剖特点。根据牦牛肾外观形态和肾内动脉血管分布,将牦牛肾分为前、中、后三个部分,中部又分为中外部和中内部。肾动脉及其分支的观察研究结果显示:牦牛肾动
食物网是生态系统最基础的组成部分,其研究对于揭不生态系统的接本规律以及指导自然生态的修复具有关键作用。本文分析了链状和环状两类三种群时空离散食物网系统的分岔和斑