基于上下文语义理解的检索系统

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:sxsdlyq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展,搜索引擎为用户获取各种信息提供方便,但随着数据量、信息量的大幅增长,存在着信息过载的问题,用户如何从海量的信息中获取有效的信息成为了亟待解决的问题。因此,利用语义关联关系,从大量信息中检索出更满足用户需求的信息具有重要的研究意义。近年来,信息检索技术已经有了长足的进步和快速的发展,但传统方法更注重词与词、词与句的匹配和相似关系,忽略了文章段落上下文的语义关联关系,以及检索词与整体段落的关系。本文利用神经网络结构捕捉长文的语义关联关系,对文档进行上下文语义理解,并结合指针网络机制,对查询的文档进行排序,以提高检索的效果。本文的主要工作如下:一、对传统信息检索方法的发展情况以及目前神经网络在信息检索中的应用情况进行了调研,针对文档检索的特点进行了分析。同时,对神经网络在文本理解上的应用进行了总结,对神经网络的理论知识如何应用到信息检索中进行了探讨。二、提出了基于指针网络的信息检索(Pointer-IR)模型。通过双向的GRU模型对文档和查询所对应的文本序列分别建模,用隐藏层的状态来抓取文本中的语义信息,挖掘文本的上下文语义特征。同时,由指针网络在自动文摘、推荐等领域的应用启发,在模型中加入了指针网络的机制,通过指针网络,使模型更加关注与查询的向量表示相关的文档片段。三、本文将Pointer-IR模型在TREC数据集上进行了实验,并且在诸多评测指标上与baseline模型进行结果对比,验证了模型的有效性。
其他文献
我国存在大量低热值气体没有被有效利用的情况,若能对这些低热值气体加以利用,将对节能环保和调整我国能源消耗结构具有重大意义。目前,低热值气体利用中存在的主要问题是其发热量偏低、附加气成分比例偏高,常规技术条件下难以对其加以利用。多孔介质燃烧技术以其独有的特点对低热值气体的有效利用具有显著优势。为了能更好的对低热值燃气加以利用,本文针对低热值燃气在燃烧过程中容易出现的与氧化剂混合不充分、脱火、着火困难
随着科技发展和国家战略的需要,特种合金的制备成为了各国争相研究的重点。钛合金(Ti-6Al-4V)以其低密度、高强度和热稳定等优良的特性被广泛应用于各个领域。然而,Ti-6Al-4V也存在硬度不足和导热系数低等一些缺陷,这些缺陷导致了Ti-6Al-4V零部件易出现表面磨损失效和疲劳断裂,并限制了其在各领域的进一步应用。因此,为了探究Ti-6Al-4V的表面摩擦磨损性能和加工特性,本文采用有限元和人
茶叶是我国重要经济作物,曾在我国农业、经济、文化以及外贸等诸多领域产生深远影响。茶叶作为中国传统饮料,一直受着广大消费者热爱。近年来,随着我国经济社会快速发展,茶叶市场竞争环境的变化以及消费者消费观念的持续改变,茶叶品牌逐渐成为判断质量好坏以及购买需求的重要影响因素。茶叶品牌可分为企业品牌和区域公用品牌,但是中国茶产业品牌的现状是由茶叶区域公用品牌占据主导。近年来,随着我国各级政府与茶企不断重视,
近海生态系统可提供全球生态系统三分之一以上的服务功能,支撑超过50%的世界人口和90%的渔业。近海污染(石油烃类和重金属)、富营养化和酸化等多重压力胁迫下生态系统的服务
血管内皮生长因子受体(vascular endothelial growth factor receptor,VEGFR),VEGFR-2介导VEGF调控的细胞信号转导通路,进而刺激血管内皮细胞增殖,导致血管生长。VEGFR-2在卵巢癌、甲状腺癌、黑色素瘤、髓母细胞瘤等多种恶性肿瘤中高度表达。肝细胞生长因子受体(hepatocyte growth factor receptor,c-Met)为酪氨
目的:本研究目的在于观察益气温阳化瘀法对慢性萎缩性胃炎(chronica trophic gastritis CAG)且证中医辨证属脾胃虚弱证患者的临床疗效,通过对照试验比较治疗组与对照组治疗前后症候积分、胃镜表现评分、胃黏膜病理积分等资料客观评价益气温阳化瘀法对慢性萎缩性胃炎(脾胃虚弱证)的临床疗效,为慢性萎缩性胃炎患者寻找安全有效的治疗方法,防止慢性萎缩性胃炎病程进展甚至癌变可能,改善预后。方
粉煤灰混凝土结构耐久性损伤不是由某一种因素单独作用造成的,而是受到两种或者多种因素共同制约。在我国华北地区,建筑物不仅受到二氧化碳的侵蚀,且夏季多雨冬季冻融循环较
随着计算机视觉以及图像处理等技术的发展,图像配准已成为其发展中一项关键且不可缺少的基础技术,被广泛的应用在遥感技术、环境监测、模式识别等领域。遥感图像配准是指对同一目标区域下的不同时段、不同角度、不同波段、不同光谱、不同传感器等不同条件下采集到的多幅遥感图像根据某种相似性度量,以此找到像素间的某种正确的对齐关系,完成几何校准的过程。目前,遥感成像技术的不断发展,图像模式的多样化,传统的图像配准技术
包虫病也被称作棘球蚴病,该病产生的原因是人体感染棘球蚴绦幼虫(棘球蚴)后其寄生于体内。在世界各地的牧区发现比例高,我国是发病率比较高的国家之一。该病对人类和大型牲畜健康均有严重危害,是当代全球共同的公共卫生问题。包虫病的早期诊断发现不仅能够减轻患者身体疼痛和心理负担,也能减轻后期治疗难度和成本费用。因此包虫病的早期诊断具有重要意义。目前,全世界对包虫病的诊断方式主要有临床、成像学、免疫学及血清检查
目标跟踪是现实世界中的基本问题。随着现代探测技术的发展、武器装备的进步、目标及环境复杂性的增加,目标跟踪系统面临诸多新问题与新挑战,密集多目标场景下的跟踪问题包括