基于XML的个性化信息检索系统研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:yiyingyan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对目前Internet上信息获取存在效率不高与“资源迷向”的问题,以及日益增长的个性化需求,提出了一个面向Web的基于XML的个性化信息检索系统模型,研究了其中的关键算法,所研究的内容目前属于信息检索和电子商务的重要研究课题和热点,具有一定的理论和实际应用意义。本文首先研究了国内外搜索引擎系统及主要算法,分析了搜索引擎系统的主要结构和存在的主要问题,并在此基础上探索了基于XML的个性化信息检索系统所涉及的关键技术和算法,主要围绕用户模型的生成和个性化搜索引擎的系统结构以及提高搜索引擎性能的关键技术三个方面进行。主要的工作是:首先通过天网日志文件对用户行为特征进行了统计分析,指出用户查询词及查询过程相对稳定,由此构造基于行为特征的用户模型,并给出相应生成算法;其次,在分析搜索引擎基本结构的基础上,提出了个性化系统实现的基本结构,并分析了其实现的关键技术;第三,在构造个性化搜索引擎原型系统的过程中,结合统计规律,确定了以提高查准率为主要目标的实现思路,改进了信息抓取策略;优化了网页去噪消重算法;提出了以单字构造中文分词词库的新方法;结合用户模型,改进相关分析方法,并拓展了相关分析的应用领域。理论分析和实验结果表明,构造的原型系统是可行和有效的。
其他文献
遗传算法作为一种基于生物界自然选择和遗传原理的高效的搜索技术,已成功的应用于工程设计,工商管理,科学实验等领域中的复杂优化问题的求解。然而,GA在进化寻优的过程中将不
无线传感器网络技术将是21世纪最有发展前景的技术之一。由于其具有组网快捷、灵活,且不受有线网络约束的优点,因而可应用于紧急搜索、灾难救助、环境监测等领域,具有广泛的应用
随着网络技术的发展,多媒体技术进入了流媒体时代,而流媒体技术的一个典型应用就是视频通信系统。本文尝试实现一种在 IP 网络中任意两个Pc终端之间P2P实时视频通信软件,其功能
为了提高图像资源利用率,快速、有效地查询和检索数据库中的图像,基于内容的图像检索技术(CBIR)便应运而生。其方法是在检索图像时,对给定的图像自动提取其特征向量,并根据匹
WebGIS(Web Geographic Information System)是地理信息系统研究中的一项重要内容。WebGIS可以使全社会范围内各领域、各部门之间的空间数据信息实现共享,极大地提高了空间信
在计算机辅助教学(CAI)软件的开发中,基于题库的自适应测试系统已成为一个重要的发展方向。目前在国际上最新的测试理论研究成果是项目反应理论,本文介绍的就是一个采用项目
BWDSP是一款高性能数字信号处理器,同时兼容16位和32位定点数据格式,采用超长指令字架构,具有强大的并行处理能力,能较好的满足高速实时信号处理的应用要求。BWDSP具有多个执
随着PC技术、多媒体技术和网络技术的高速发展,数字图像逐渐成为信息的主要载体,并且在各行各业都得到广泛深入的应用。随之也逐渐形成了各种图像数据库。如今,大部分的数字
链编码是数字图像处理领域中重要的工具,它将二维的数字图像通过一维的编码表示,大幅度减少了存储空间,各种链编码的优良特性也给数字图像处理和分析带来了便利。获得图像的链编
支持向量机算法是统计学习理论中最年轻的分支。它以统计学习理论中的VC维理论和结构风险最小原理为基础,根据有限的样本信息在模型的复杂性与学习能力之间寻求最佳折衷,获得了