文本信息检索的代数模型综述

来源 :吉林大学学报(信息科学版) | 被引量 : 0次 | 上传用户:baoyw00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了比较各类模型的性能,研究进一步改进文本信息检索各类模型的可能方法,综合已有的试验和研究报告,概述了文本信息检索模型中一类模型——代数模型概念和研究现状,并分析了目前文本信息检索的相关性、相似度、召回率、准确率等概念。结果表明,这几个模型尽管来源于神经网络、向量空间等不同的思想,广义向量空间模型、潜在语义标引模型的计算复杂度比向量空间模型高,但此类模型依据评测在准确率和召回率上相近,经典向量空间模型相对而言,有简单、复杂度低和可作为检索框架,而不仅仅是检索模型的特点。为便于研究者研究、改进、评测信息检索的代数模型,评价了权威的TREC(The Text Retrieval Conference)和两个代表性的研究系统Smart和Lemur。
其他文献
本文从C2C下的网购现象入手,分析了网络商店声誉的形成机制,利用博弈论的思想方法建立网络商店声誉模型,为了证实网络商店声誉对网络商店经营者和消费者有正向促进作用。正本
水资源是我国经济发展的原动力,重要性不言而喻。纵观我国水资源总量,绝对数量并不少,但人均相对水资源拥有量较少,是水资源供需矛盾尖锐的国家之一。而石家庄市水资源人均占
随着“三农”问题的不断解决,农村整体发展水平呈蓬勃向上之势,身处于此的农村普通高中青年教师生活水平也得到提高。但与城市普通高中青年教师相比,农村该教师群体的生存状态仍
近年来我国社会经济稳定发展,社会各行各业对电力的需求也日益增加,在此背景下,必须加快推进变电站的施工建设,方能有效满足社会各方面的用电需求。为保证社会的正常稳定用电
贾平凹及其作品在中国当代文坛上无疑是一道独特的景观。本文正是立足于《废都》、《白夜》、《土门》和《高老庄》这四部长篇小说,探寻其所遵循的内在精神脉络,以剖析贾平凹90
微型博客简称微博,它是为用户提供分享信息、获取信息服务的社交媒介,由于微博上的转发、评论、收藏、点赞等功能使微博的信息传播速度超越于其他媒介。近年来更多用户选择微
随着金融消费权益保护工作的不断开展,如何更有效地保护金融消费者权益成为金融消费权益保护工作的重要内容。本文以人民银行天津分行对产品干预的探索实践为例,就如何运用产
本文在阐述国际金融中心的定义、特征的基础上,从历史与现实比较、国内外比较的角度分析了上海国际金融中心的历史、进展与现状,在国际、国内的地位,及存在的主要差距与问题,
筏板基础在高层建筑结构中得到了广泛的应用,筏板基础的研究成为了工程界广泛关注的课题。过去人们对筏板基础的受力变形特性进行了大量的研究,取得了一些研究成果。但由于筏板
近年来,我国金融业综合统计工作得到了党中央、国务院领导的高度重视,2012年初召开的全国金融工作会议上明确提出要加快建立"统一、全面、共享"的金融业综合统计体系。日本是