【摘 要】
:
Internet技术的普及与发展使得国际互联网日益成为当今信息资源最为丰富的计算机网络,如何在互联网上快速有效地搜索出所需要资源已成为人们普遍关心的问题之一。要实现信息
论文部分内容阅读
Internet技术的普及与发展使得国际互联网日益成为当今信息资源最为丰富的计算机网络,如何在互联网上快速有效地搜索出所需要资源已成为人们普遍关心的问题之一。要实现信息的检索首先需要将互联网上的文档信息与用户检索要求相比较,然后将满足用户要求的文档呈现给用户。在信息检索中文档信息在计算机中是用文档特征来描述的,如何准确地表达文档特征是信息检索过程中的基础。文档特征表示是文本检索领域研究的最重要的问题之一,它决定着文档的分类与聚合,也最终决定着文本检索系统对用户查询的反应能力(查全率、查准率)。信息检索技术正朝着个性化、智能化的方向发展,个性与智能的信息检索根据用户的检索要求将信息查询结果反馈给用户。本文分析了信息检索中传统文档特征表示的布尔逻辑模型和向量空间模型的优缺点:布尔逻辑模型虽机制简单、容易实现,但是它的分类能力有限且逻辑表达式过于严格;向量空间模型将文档映射到连续域向量空间,为进一步的权重计算等多元处理提供了基础,但容易忽略文档集合中各个文档的一些共有特征。本文在向量空间模型知识的基础上分析了使用人工神经网络计算文档特征项权重的可行性:利用人工神经网络对样本集进行学习的功能、函数逼近功能、人工神经网络的泛化能力以及文档中各词语的Zipf词频-词序关系,在人工神经网络的输入端输入各词语的频率,通过对人工神经网络进行训练、调整神经网络权值和阈值来优化网络,最后由神经网络输出端获得文档特征项的权重。
其他文献
由于企业在信息化过程中缺乏一个整体规划,导致企业内出现大量的信息孤岛,不能有效地共享信息,更不能实现业务流程的协作和自动化。企业应用集成(EAI)应运而生。随着动态电子商
本文研究工作主要围绕以下2个方面进行: 第一、提出了一种基于健壮主成分分析方法的无监督异常检测方法。首先,引入了健壮距离估计以解决传统入侵检测方法对训练样本的离群
随着计算机网络与数据库技术的迅速发展和广泛应用,商业智能系统中的分析型处理(OLAP)在各种商业领域中扮演越来越重要的角色。随着数据处理技术在企业的成功应用,传统的OLAP数据
SAT问题(Satisfiability problem),是第一个被证明的NPC(Non-deterministicPolynomial Complete)问题,在计算机科学理论和应用中具有重要的意义。对于理论研究,它是计算复杂性理
随着Internet技术与多媒体技术的飞速发展,多媒体通信已经成为人们之间交流信息的重要手段,多媒体信息的安全与保密显得越来越重要。对于多媒体信息,如常用的图像信息,传统的加密
近年来,随着无线局域网(WLANWirelessLocalAreaNetwork)的高速发展和IEEE802.11标准的不断普及,在WLAN中如何对实时业务提供更好的服务质量(QoSQualityofService),引起了人们广
网格信息服务是网格系统中负责管理资源信息的一系列服务集合的统称,其中包括资源描述、资源发现、资源监控和资源推荐等。随着资源规模的日益扩大,资源信息总量急剧增加,如何高
数据库知识发现(KDD)与机器学习相比,它的一个很重要的特点就是数据量巨大,因此要求学习的效率必须很高;另外,由于数据库知识发现最终是面向人的,因此人们也希望获取的规则能尽量
网络的广泛应用使网络安全日益成为一个突出的课题。入侵检测系统(IntrusionDetectionSystem,简称IDS)是近年来网络安全研究的热点,它是指用于对计算机和网络上违反安全策略的
随着Internet的飞速发展,计算机网络已经在社会、经济、文化和人们的日常生活中扮演着越来越重要的角色。人们在使用计算机网络的同时,也深深的注意到网络安全的重要性。随着网