基于语言模型的XML信息检索的研究与实现

来源 :内蒙古大学 | 被引量 : 5次 | 上传用户:ivantesr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅速发展,Internet上的信息量正呈指数级的方式递增。因此,为使人们能够有效地从浩瀚的信息海洋中获取有用的信息,各种Internet信息检索服务应运而生。但是,仅仅检索出文档的检索任务已经不能完全满足人们对信息的需求了。人们希望能够获得更加准确的,粒度更小的信息。而XML作为一种自描述性的标记语言在很大程度上解决了这个问题。因此,XML信息检索已成为目前信息检索领域的研究热点之一。在XML信息检索中,有效的检索模型和索引机制能够提高检索系统的整体性能。目前,在检索模型上,基本上采用传统的信息检索模型,对于语言模型在XML信息检索上研究还不是很多。而语言模型在信息检索上的优势也被许多研究所证明。因此,在XML信息检索上进行语言模型的研究是很有意义的。本文提出了一种基于语言模型的XML信息检索模型,主要对目前信息检索领域流行的语言模型进行研究与改进,使之能够进行XML的结构和内容(CAS)检索,从而达到提高XML信息检索的性能。其次,为适应该模型的检索,本文又提出了一种基于倒排表技术的XML索引,并利用改进的Dewey编码来更好地存储和计算结点间的关系,并且优化了编码的存储。最后,实现了该XML信息检索系统,并通过实验证明了其有效性。
其他文献
移动机器人的研究和开发近些年来受到了人们的高度重视。机器人在运动的过程中具有根据周围环境的变化而自主采取相应措施的能力,人们对机器人的这种能力的要求越来越高。因
云计算是一种允许用户通过网络,随时随地、方便、按需地使用共享资源池中可以快速供给和释放的资源,且只需很少管理工作或与供应商联系的模式。弹性是云计算的一个非常重要的
人脸检测作为人脸信息处理中的一项关键技术,近年来在模式识别与计算机视觉领域中已经成为一个十分活跃的研究方向,具有极高的学术研究价值和商业应用价值。随着智能化信息处
随着信息时代的来临,大量以文本格式存储的信息出现在Internet、数字图书馆及公司的Intranet上,基于人工智能的文本分类是处理这些文本信息的重要支撑技术。特征提取及文本表
伴随着互联网的飞速发展,P2P(Peer-to-Peer)网络作为一种分布式计算架构,进入我们的视野和生活,成为近年来业界研究和关注的一个焦点。P2P应用的蓬勃发展,也带来了种种的安全
随着计算机应用的不断普及,越来越多的生产企业依靠IT技术来缩短产品的生产周期、提高产品的质量水平、完善制造工艺。连铸作为炼钢的重要环节,如何缩短产品的生产周期、提高
由于校园网初期建设的局限性,网络中各个应用系统的建设由各个职能部门自己负责,没有遵循统一的数据标准,数据格式也各不相同,系统间无法实现有效的数据共享,于是便形成了局
学位
本文对参数曲线曲面造型中的一种新的几何造型方法--非线性样条曲线曲面造型进行了深入的研究。其中包括基于三角/双曲多项式的类二次非均匀B样条曲线曲面,基于代数多项式、三
图像插值技术是图像处理领域的基础技术,在图像处理领域有着重要的应用。经典的插值方法,一般是基于低通滤波的思想,实现简单,算法的计算复杂度可观。但是不能很好的处理图像
文本蕴含识别作为自然语言处理中的一个重要基础任务,在问答系统、信息检索、信息抽取等很多任务中都有实际应用。传统的文本蕴含识别方法主要有基于人工特征的分类方法、基