基于多层Markov网络的信息检索模型

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:quuizx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的蓬勃发展,信息资源数量呈指数级的增长,信息检索技术也在不断地进步。通过信息检索系统,用户可以迅速地接触到丰富精彩的信息,对于生活、工作和学习都带来了许多便利。然而面对海量的数据信息,核心的问题是如何快速又准确地从中找出与用户需求相关的内容。仅仅把文档中的词与查询词进行匹配的方法并不能带来良好的检索结果,因此挖掘更加有效的信息来提高检索精度成为一个研究热点,已有的研究表明将各方面的附加信息有效地融合进信息检索的过程将带来更好的检索效果。对一个具体查询而言,可以充分利用与已有查询的相关性、词语相关性和文档相关性等信息进行查询扩展和重构。基于这种思路,本文通过分别构造查询网络、词网络和文档网络及他们之间的关系提出了多层Markov网络的信息检索模型,模型可以融合词间关系、文档间关系和查询间关系,为了有效降低计算量,给出了基于团计算模型。实验表明本文的模型能够有效融合三方面的信息,并较大幅度地提高检索效果。本文的创新点主要有:1.通过对训练文档集的学习,根据词与词相关性、文档与文档相关性和查询与查询之间的相关性来构造Markov网络。2.为了避免加入较多的噪音信息,通过设定阈值,同时为了有效地降低计算量,给出了团的计算模型,分别提取词团、文档团和查询团信息,将这三种信息分别赋予不同的权重,融入至文档与查询的概率公式中,计算文档与查询的最终相关概率。
其他文献
视觉目标跟踪在实际应用中得到了广泛的研究,如智能视频监控、人机交互、智能交通、虚拟现实等。虽然大量的跟踪算法已被提出,但鲁棒和有效的视觉目标跟踪系统仍然是一个非常
随着信息与通信技术的飞速发展,信息安全、通信保密尤其是网络安全日益受到了人们的重视。本文主要是对IDEA 算法的研究及其变种的实现。本研究具有一定的理论意义和实用价值
软件测试是迄今为止人们所能找到的保证软件质量的最好方法,它能够有效地发现软件中的许多缺陷。软件测试保证了软件开发过程的高效性,保证了开发出来的软件产品的高质量和可用
企业竞争的成败取决于企业成本的高低。企业资源计划(Enterprise ResourcePlanning,简称ERP)的广泛认同和实施,给企业带来了丰厚的效益。然而面对日趋激烈的市场竞争,企业需要更深层次的信息来辅助决策;同时,随着ERP的实施,企业累积的大量数据由于ERP自身的缺陷缺乏深层次的利用。因此,本文提出在ERP的成本管理中耦合智能决策技术,为企业提供有效的决策手段。本文设计了ERP成本
近年来,语音识别技术取得了巨大的进展。人们迫切的希望把它推向广泛的实用领域,而不满足于只是理论研究。本文以教研室的《基于鱼类生物模型的计算机动画》项目为背景,分析
频繁项集的挖掘是多种数据挖掘任务中至关重要的一步,然而由于潜在的频繁项集的数据与项的个数呈指数倍关系,导致了频繁项集的数量都往往大得惊人,使用户难以处理和理解,不仅仅影
论文以LogGP并行计算模型的长消息通信机制为核心展开研究。并行计算模型为并行算法和并行计算机系统结构的分析与设计提供了具有指导意义的理论界面和模型框架,它是并行计算
随着“数字地球”概念的提出,地理信息系统和时空数据库已经成为研究热点。而今移动通信技术的高速发展,时空数据库越来越多地应用在地理信息系统、交通管理、定位、城市规划、
SNMP(Simple Network Management Protocol,简单网络管理协议)是TCP/IP网络上应用最广泛的网络管理协议,网络上的服务器、工作站、路由器等各种网络设备基本都支持这一协议,因此
随着Intemet技术的迅速崛起和在全球范围内应用的飞速发展,信息共享已经成为—种必然的要求,地理信息也不例外。 为了促进地理空间信息的共享和互操作,开放地理信息联盟(OGC:O