【摘 要】
:
Ad-hoc检索任务主要是用户通过一个查询指定其信息需求,而后信息检索系统会搜索可能与用户需求相关的文档返回给用户。随着深度学习的发展,研究人员提出了许多神经网络匹配模型并在ad-hoc检索任务上取得了显著的性能提升。现有的神经网络匹配模型将查询或文档中的单个词项或n-gram片段的向量嵌入作为一个匹配单元,先将每个查询匹配单元与文档中所有的匹配单元进行局部交互计算相关性特征(例如,cos相似度)
论文部分内容阅读
Ad-hoc检索任务主要是用户通过一个查询指定其信息需求,而后信息检索系统会搜索可能与用户需求相关的文档返回给用户。随着深度学习的发展,研究人员提出了许多神经网络匹配模型并在ad-hoc检索任务上取得了显著的性能提升。现有的神经网络匹配模型将查询或文档中的单个词项或n-gram片段的向量嵌入作为一个匹配单元,先将每个查询匹配单元与文档中所有的匹配单元进行局部交互计算相关性特征(例如,cos相似度)到一个匹配特征矩阵,然后使用神经网络提取有效匹配特征并预测文档相关性。我们发现这种匹配思想对文本匹配单元作出了一个独立性假设,即神经网络匹配模型作出的最终相关性预测是先分别计算文档在每个查询匹配单元下的匹配程度再将其进行叠加得到的。然而,在真实检索环境下由于文本匹配单元间存在依赖关系,导致这种假设并不总是成立的。同时,经过基于概率论的形式化分析和比较,我们发现当前神经网络匹配模型的匹配思想遵循经典概率,是没有能力构建查询和文档中不同匹配单元间依赖关系所产生的匹配特征,这会造成较大的文档相关性预测偏差从而影响检索性能。在本工作中,我们在量子概率框架下提出了基于量子干涉理论的神经网络匹配模型(QINM),该方法能够将量子概率论中自然包含的干涉现象用于有效构建查询和文档中不同匹配单元产生的依赖匹配特征。具体地,QINM先构造一个查询-文档复合系统,然后通过对复合系统的观测将文档的概率分布编码到约化密度算子中,并通过n-gram窗口卷积网络和查询注意力机制提取算子中的有效匹配特征。最后,利用由多层感知器组成的评分层来计算最终的排名分数,并使用Learning-to-Rank算法对整个神经网络进行更新。在两个基准数据集上的实验结果表明,我们的方法比量子启发的检索模型和一些著名的神经检索模型更适合于ad-hoc检索任务。
其他文献
目的:分析早期应用抗凝治疗对新冠肺炎患者病情动态变化过程和转归的影响。方法:回顾性分析2020年1月22日至2月23日来自于承德市第三医院8例新冠肺炎患者动态临床表现、实验室检查、影像学特征,并分析病程早期应用小剂量低分子肝素抗凝治疗对病人转归的影响。结果:8例患者中,普通型患者4例,重型患者4例,经过积极抗凝治疗,未发展危重型病例,亦未出现死亡病例。8例患者平均住院时间15.88d,4例重症患者
时滞系统的分析和控制在过去的几十年中得到了控制和应用数学领域前所未有的关注.这是因为,一方面,时滞系统在工程实践中具有广泛的应用,如工业过程控制、机械加工、燃烧系统、网络化系统和生物系统等.另一方面,时滞系统作为分布参数系统的特例是无穷维控制系统,因此,在数学上和实践中,时滞控制系统都是很难处理,以稳定性和镇定为例,针对一个时不变的时滞系统,稳定性和镇定的主要技术难点在于系统具有无限多个特征根.因
T-S模糊控制理论日趋完善,但应用到实际工程中往往会受到限制。其主要原因是当系统中的时变参数过多时,前件变量和子系统的数目便会增加,控制器增益矩阵所需满足线性矩阵不等式的个数也会呈指数增加。因此,本文针对此问题提出并研究了模糊变参数系统理论。模糊变参数系统是一种集T-S模糊系统和线性变参数系统诸多优点为一体的新型非线性时变模型,它继承了T-S模糊模型有效处理非线性系统的优点,又保持了线性变参数模型
作为一类重要的混杂系统,切换系统具有重要的理论研究和实际应用价值。实际系统中存在不确定参数、未知控制方向、随机干扰、量化输入及不可测状态等因素,往往会使系统的性能恶化,甚至导致系统不稳定。另一方面,连续变量动态和离散事件动态的相互作用使得系统动态行为更加复杂,控制器设计和稳定性分析问题亟待解决。近年来,切换非线性系统的控制研究虽然取得了丰硕成果,但针对不同幂次情形的研究结果还相对较少。本文将利用增
一致性问题作为多主体系统协同控制中的一个基本问题,已引起了越来越多的关注,其中一个很重要的原因在于很多实际问题,例如无线传感器网络中的时钟同步及节点定位、分布式编队控制、分布式优化等问题,都可以通过适当的变换转成一致性问题。不论是理论,还是实际应用,对于一致性问题的研究,都具有重要的意义。 针对理想环境(不考虑时延、噪声等情况)下一致性问题的研究,通过利用拉普拉斯矩阵或随机矩阵的性质,已经得到了
近年来,多自主体系统的协作目标定位与巡航控制问题已经持续成为国内外不同学科领域研究者的关注点,这是由于其在国民经济、军事应用以及人民生活等领域具有广泛的应用背景。在一些具体的应用任务中,如网络系统的自主体定位,蜂窝网络中的手机定位,目标巡航跟踪,安全监督等研究中,所有的自主体必须定位目标的位置,在更复杂的任务中,自主体甚至还需要巡航跟踪目标。当目标的位置未知时,这给目标巡航控制律的设计和系统的稳定
社会经济的飞速发展进一步带动了科学技术的进步,同时信息化技术也向生活生产中的各个领域渗透。社区作为社会的重要基础结构,以其自身的综合性发展构成了整个社会的信息化发展,社区的信息化进程直接反映了整个社会的信息化进程。建立和谐信息化社区是建设和谐社会的重要基础,随着“互联网+”的信息化推进以及城镇化建设进程的加快,社区功能的提升和发展要求我们要以更加便捷的方式管理和解决社区中的信息化服务问题,传统的管
再制造是废旧产品回收再利用的有效途径之一,有助于降低成本、减少资源浪费和环境污染,具有巨大的经济效益和社会效益。伴随废旧产品回收产生的逆向供应链与传统正向供应链结合,形成了闭环供应链,实现了系统利润最大化。本文针对零售商主导、第三方和零售商主导混合回收模式的闭环供应链系统动力学模型进行深入研究,对影响收益相关因素进行优化,使制造商、零售商和供应链的收益最大化。 为提高供应链的利润,应用博弈论理论
很多领域的实际应用问题都可建模成四个甚至更多目标的优化问题,这类问题称为超多目标优化问题,而两个和三个目标的优化问题称为多目标优化问题。与多目标优化问题相比,超多目标优化问题的求解更加困难。主要原因在于:1)随着目标个数的不断增加,Pareto最优解的数量呈指数级增长,而现有的支配方法选择压力往往不够,无法从大量的Pareto最优解集中高效地筛选出真正有潜力的代表解集;2)由于目标个数的增多,导致