【摘 要】
:
随着人工智能技术的飞速发展,自然语言处理相关技术也发展迅猛。文本匹配算法作为自然语言处理的核心技术之一,有许多广泛的应用场景,例如信息检索,问答系统,机器翻译,对话系统,复述问题等。传统传统文本匹配算法主要通过人工对文本特征进行建模,模型效果很依赖人工特征的设计,并且在表述文本上会产生维度灾难问题及数据稀疏问题,严重限制自然语言处理的发展。现阶段文本匹配主要采用深度神经网络的技术,借助大量的训练数
论文部分内容阅读
随着人工智能技术的飞速发展,自然语言处理相关技术也发展迅猛。文本匹配算法作为自然语言处理的核心技术之一,有许多广泛的应用场景,例如信息检索,问答系统,机器翻译,对话系统,复述问题等。传统传统文本匹配算法主要通过人工对文本特征进行建模,模型效果很依赖人工特征的设计,并且在表述文本上会产生维度灾难问题及数据稀疏问题,严重限制自然语言处理的发展。现阶段文本匹配主要采用深度神经网络的技术,借助大量的训练数据,通过深度学习技术让模型自动学习特征间的依赖关系。相较于传统文本匹配算法,能够从大量训练数据中自动学习文本的语义信息。文本针对基于神经网络的文本匹配算法进行研究,本文主要研究内容包括以下几个方面:(1)首先,本文对基于深度学习的文本匹配的原理进行了研究,然后对神经网络的相关技术进行了阐述,包括深度神经网络,卷积神经网络,循环神经网络等,最后重点对神经网络的词表征技术进行了相关分析,其中包括静态词向量模型,动态词向量模型等,并针对不同词向量技术的适用场景以及各自的特性进行探讨。(2)其次,文章对三类文本匹配算法进行研究并展开相应的实验分析,包括基于双塔结构的浅层语义匹配算法DSSM模型,基于注意力机制的深度语义匹配算法ABCNN模型,以及交互式语义匹配算法DRCN模型,在分析这些算法的同时,对词向量,神经网络,包括卷积神经网络以及循环神经网络在语义提取,语义匹配过程中的作用进行分析,并对其文本匹配算法的可解释性进行阐述,然后针对实验数据对比出三种模型的优势与劣势。(3)最后,基于前文分析结果提出一种基于多粒度多交互的文本匹配算法SE-ACNN。模型通过引用多粒度嵌入信息,提升嵌入向量的特征表示能力;通过使用SE-Block机制,增强文本对内部特征的选择能力;通过使用注意力Attention机制,加强文本对之间信息交互能力;最后通过一种基于向量空间变换的匹配度量方法,优化文本匹配能力。通过对开源的文本匹配数据集LCQMC进行实验进行验证,在测试集上的F1值达到0.8112,相比DRCN模型提升了1.31%。相比传统的双塔结构和交互式匹配算法,该模型可以有效的增加模型收敛速度,增强文本匹配的鲁棒性。
其他文献
在我国进一步探索空间领域的进程中,星载电子设备的功率不断增大,喷雾冷却以其热移除能力强、换热温差小、温控严格、无沸腾滞后等优点,在该领域具有广阔的应用前景。目前国
在气候变化背景下,食品消费引发的温室气体排放问题备受学界关注。城市化推动我国居民膳食结构、就餐方式以及人口流动格局的整体演变,进而影响食品消费的温室气体排放和气候
Ti-Zr-Nb-Sn体系作为一种新型的生物医用材料,具有密度小、比强度高、耐腐蚀性能及生物组织相容性良好等一系列优点,近年来越来越受到材料研究者的关注,深入而系统地研究该体系有关的金属间化合物的结构稳定性、力学性能、电子结构特性及其热物理性能等,对进一步优化和设计新型医用合金具有重要意义。因此,本文利用基于密度泛函的第一性原理方法计算了Ti-Sn、Zr-Sn和Hf-Sn三个体系金属间化合物的结构
全钒氧化还原液流电池(简称钒电池)是一种很有发展潜力的大型储能装置。作为钒电池的关键部件之一,隔膜具有分隔正负极电解液的作用,同时允许特定离子通过构成电流回路。钒电
对于一个连续优化模型来说,通常它由两部分变量构成,一部分变量是参数变量,另一部分变量是决策变量.所谓一个正问题,即当参数变量已知时进而来求解最优决策变量的值.而有些实
伴随气候变化与人类活动,径流序列表现出非平稳性及复杂性特征。研究流域径流的非平稳性特征并开展预测,可为流域水资源高效利用提供理论指导。论文以澄碧河平塘水文站以上流域为对象开展非平稳性特征分析及预测研究,其主要工作内容与研究成果如下:(1)运用趋势分析、突变分析、周期分析和演变趋势持续性分析方法对流域平塘水文站月径流进行非平稳性特征研究。结果表明:55a月径流中,一月、三月、六月、十月和十二月呈增加
介晶(mesocrystals,MCs)是一种由纳米晶以结晶学有序的方式自组装形成的具有纳米超结构的新材料。介晶因其独特的分级结构而具有比单晶更大的比表面积和孔隙率、比多晶更高的
沸石分子筛由于其独特的结构和性能在吸附、催化、分离等方面有非常广泛的应用,开发沸石分子筛绿色高效的合成路线是当前研究热点之一。利用层状硅酸盐麦羟硅钠石为硅源转晶
随着微纳器件与系统集成度的不断提高,微纳器件逐渐从单一平面结构发展为三维结构。微纳尺度三维结构在电子信息、生物医疗等领域具有广泛的应用前景,其制造技术对三维微纳器
我国生活饮用水面临着水源易受污染、二次污染等问题,伴随着人们对身体健康和生活品质需求的不断提高,饮用水水质不足以完全满足居民对水质的要求。我国居民饮用水的水质差别较大,针对不同类别的水质需采用不同的深度处理技术,通过调整工艺或参数使处理效果最优化。本论文在对国内外权威饮用水标准进行对比研究的基础上,选择了10项常见水质指标作为后续调研和深度处理试验的研究指标。通过对我国典型城市生活饮用水水质进行调