论文部分内容阅读
搜索引擎作为互联网上最主要的信息获取工具,在各个领域都已得到广泛应用。近年来频频爆发的局部战争、恐怖事件、地震、海啸、雪灾、火灾、流行性传染病、煤炭安全生产以及电能稳定输送中的重大事故等突发事件,使得各类危机管理、突发事件的预警、应急决策模型及其应用系统应运而生。但是,它们大多用的还是搜索引擎所采用的全文检索技术,为用户提供的查询检索服务还是“one size fit all”的模式,站点的设计没有考虑用户的差异性,对于所有访问者,都呈现同样的拓扑结构和表现方式。再加上网络信息量迅猛增加和网络信息组织的无序性,它们已经不能为不同的用户提供快速、准确的,令其满意的,不同的个性化的反馈信息。针对以上问题,本文提出了一个二次语义检索框架并对其中涉及的关键技术进行了详细的阐述。首先,本文介绍了概念图的相关知识,概念图与其它语义知识表示方式的比较,阐述了概念图的构造与知识表示体系,以及概念图与汉语之间的映射,简单介绍了常用的概念图工具。接下来,讨论了用户模型在检索框架中的重要性,对加权概念网络做了详细的研究,提出了概念结点的表示模型,分析和研究了加权概念网络的构造与调整方法及其相关应用。在以上讨论的基础上,提出了二次语义检索框架,采用WCN(Weighted Conceptual Network加权概念网络)表示用户模型,以概念图的形式定义需求中概念间的语义关联关系,充分表达用户的真实需求。同时,给出了概念图和加权概念网络的存储结构,以及概念图与加权概念网络的匹配算法,并利用该算法对初步检索的结果进行二次排序,使结果更富有个性化。实验结果表明,信息反馈的准确率得到了有效地提高。