论文部分内容阅读
传统的基于网页“超链”的搜索引擎只能查到HTML格式,导致以其他形式存储的信息会长期地“沉没”在信息的海底中;传统搜索引擎采取的是集中式的资源存储和管理方式,会导致硬件成本过高,性能瓶颈,单点服务失败等问题;另外传统的搜索引擎存储的资源索引信息更新不及时,时常会导致过时连接和无效连接等缺陷。
网格的出现为实现计算资源、存储资源、数据资源、信息资源、知识资源及专家资源等的全面共享提供了解决方案。网格计算具有分布性、异构性、可扩展性和动态自适应性等特点。与此同时,P2P正在勃然兴起,与网格一样,P2P的最终目的也是要将各种分散的资源充分地利用起来。P2P提供了在分布式网络上共享资源,高效发现资源的能力,而且P2P网络具有很好的可扩展性能。P2P与网格在设计与使用目标上都具有相似性,它们之间有许多值得相互借鉴的地方。因此,我们相信,网格最终将与P2P融合为一体,形成一种大规模、具有分布、动态、异构、可扩展、自组织的资源共享、资源搜索和发现的网络环境。
本文的目标是设计一种将网格技术和P2P技术相结合的搜索引擎,为用户提供对大量分散在节点上的异构共享资源的及时有效地搜索和发现功能。将网格技术和P2P技术相结合的搜索引擎涉及到几个方面的问题,典型的有网络结构,网格服务资源描述,描述信息存储和维护,资源搜索,查询消息路由,结果集成等等。本文在网格结构中,采用分层的纯粹式分布式结构,这种结构的特点是无中心服务器,不会产生性能瓶颈和单点失败的问题,并在建立P2P网络过程中采取网络延时做为建立邻居关系的基础,保证了网络底层的连接速度;在网格服务资源描述中,采用资源描述框架(RDF)描述资源的元数据,将资源表示成资源(resource)、属性(property)和值(value)三部分,使用Web服务方式包装底层各种数据源,解决了异构问题;每个节点上都维护一定范围内的资源描述信息,用以在查询路由时作为索引信息,指导查询转发方向;每个节点都是对等的,功能都是完整的,都能提供注册、本地查询、查询路由和结果集成等功能;资源查询,采用对flooding的改进算法IBFS,查询消息根据资源描述信息与查询信息的匹配指导查询路由;在结果集成的过程中,将结果的合并和排序分散到P2P网络中的各个节点上,充分利用了网络中的资源。
最后,通过性能分析和模拟实验,验证我们提出的基于P2P的网格资源搜索模型是切实可行的。