基于Java的元搜索引擎的研究及实现

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:chenzeqian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,Internet已经发展成为当今世界最大的信息库,并且成为全球范围内传播信息和获取信息的最主要途径之一。Internet上出现越来越多的信息,同时也出现了越来越多的搜索引擎。怎样通过这些搜索引擎找到自己想要的信息仍然不是一件易事,而想要搜索到高质量的信息就更困难了。元搜索引擎的出现解决了一定程度上的问题。 元搜索引擎是一种建立在独立搜索引擎之上的搜索引擎。用户只需要递交一次检索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将搜索查询结果集中起来以整体统一的格式呈现到用户面前。在这里我们选择Java+XML作为我们系统的技术平台。Java提供了一个跨平台的方案,可支持分布式处理环境。Java语言成为了结合XML(eXtensible MarkUD LangUage)的最佳选择。XML以一种开放的自我描述方式定义了数据结构,在描述数据内容的同时能突出对结构的描述。由于数据显示与内容分开,XML定义的数据允许指定不同的显示方式,使数据更合理地表现出来。在提取单独搜索引擎的结果方面,我们没有使用java自带的包,而是使用了功能更加强大的HTTP协议的客户端编程工具包HttpClient,在系统开发过程中也使用了Ajax技术,这两种技术的使用使开发的系统更加稳定,功能更完善。在确定权威页面的工作上,分别提到PageRank和HTTS两种算法,并对两种算法做了分析和比较,根据本系统的特点选择了使用HITS算法。 本文介绍了搜索引擎和元搜索引擎的发展历史,讨论了元搜索引擎的基本工作原理并对元搜索引擎进行了分类,比较了元搜索引擎与独立搜索引擎相比的优点,讨论了元搜索引擎的几个关键技术,并分析了元搜索引擎面临的问题和将来的发展趋势。作者提出了一个元搜索引擎模型,首先讨论了元搜索引擎的基本体系结构以及设计时应考虑的问题,接下来较详细地介绍了元搜索引擎系统的体系结构、系统整体上作流程以及各个功能模块描述。最后,将系统开发过程中比较重要的实现细节及代码作了详细分析。
其他文献
工作流技术是近年来发展最为迅速的几项新技术之一。它是实现企业业务自动化的核心技术,也为协调复杂业务过程活动提供了有效的方法。工作流管理系统是开发和执行工作流的工具
模型驱动架构(MDA)是由OMG定义的一个软件开发框架,它以模型作为整个软件开发过程的中心,贯穿于需求分析、设计、实现和维护的全过程。MDA严格区分系统的功能规约与实现细节,在
三维空间数据场可视化分为“直接体绘制”和“间接体绘制”两种不同的方法。其中,MC(Marchling Cubes)算法是广泛应用的“间接体绘制”算法之一,该算法通过生成中间几何图元来
多源传感器图像融合就是将来自多个信息源的图像数据加以处理与综合,产生比单一传感器数据更精确、更可靠的描述和判决,使融合图像更符合人和机器的视觉特性,更有利于诸如目标检
随着因特网和个人电脑应用的不断普及,信息安全问题受到人们越来越多的关注。日益增多的各类黑客攻击、木马和计算机病毒严重地威胁着全球的计算机信息系统。其中,个人电脑又是
随着IEEE 802.11等无线接入技术的发展,无线Mesh网络已经逐步成为企业界和消费者瞩目的焦点之一。如何提高无线Mesh网络的容量来满足用户日益增长的带宽需求(如实时音频、视频
随着我国信息化发展进程加快,信息化覆盖面扩大,信息安全问题也就随之增多,其影响和后果也更加广泛和严重。同时,信息安全及其对经济发展、国家安全和社会稳定的重大影响,正日益突
在这个信息化时代,由于互联网的迅速发展和电脑的普及,万维网已成为具有无穷潜力的信息索取和信息交换能力的全球信息资源中心,它对人类的各方面行为将产生日益重要的影响。
缺陷管理作为软件项目管理中的重要环节,目前其管理模式依然是:找出缺陷、修改缺陷、进行回归测试这种面向流程处理的传统模式。如何有效的对软件缺陷进行管理?如何对缺陷进行
信息检索是中文信息处理中的一项重要课题,其内容涉及到术语抽取、词义消歧、句法分析等方方面面,同时在机器问答、自动文摘、统计机器翻译等各领域又有着广泛的应用。为了减小