基于对等网络的资源搜索策略的研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:liweibin522
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着Internet的飞速发展、网络带宽的成倍增加以及计算机计算能力的大大提高,对等网络逐渐引起了来自工业界和学术界越来越多的关注。对等网络通过对等和分布式的方式,在网络中不同节点间提供空闲的CPU处理能力,磁盘空间以及网络带宽。除了采用中央索引服务器的集中式对等网络之外,从网络拓扑上,对等网络还可以分为无结构对等网络和基于分布式哈希表的结构化对等网络。与任何大规模的分布式系统一样,对等网络系统成功与否不仅在于其网络结构的合理和有效,而且在很大程度上还取决于其资源搜索策略的灵活性和可扩展性。对等网络的资源搜索策略可以分为两种类型:基于关键字的搜索和基于全文的搜索。无结构对等网络采用类似泛洪的盲目搜索机制,虽然可以支持上面两种类型的查询,但搜索的效率和可扩展性都较低;结构化对等网络依据文档标识符进行查找,可扩展性和查找效率都较高,但是采用内容的哈希(Hash)值作为索引,其索引和内容语义无关,无法真正做到全文检索。对等网络的资源搜索的研究中,逻辑拓扑结构的组织方式和数据索引的放置方式是两个很重要的研究内容。在基于关键字检索的对等网络平台的设计中,首先充分考虑节点网络邻近性特征,通过节点类划分的方法将物理距离较近的节点归为一组,以确保网络中邻近节点间的路由过程大部分能在组内部完成,从而避免了Chord等网络存在的绕路问题,并能够降低系统路由时间开销,减少发送消息的数量,据此提出了使用Landmark策略进行节点类划分的方法;然后,由于网络中的工作负载都是有空间和时间的局部性,而且用户总是趋向于查找自己感兴趣的资源,这些资源通常属于同一个类别,因此根据数据的类别进行数据索引的存放,使得同一类数据索引放在相近的节点上,然后根据类检索表,可以快速的找到同一类别的数据;另外,小世界现象在网络中广泛存在的,将非确定性缓存策略应用于路由表,然后采用SW(Small World)缓存置换策略,使得对等网络能够逐渐收敛于小世界模型;在最后的理论分析和性能测评中,表明了这种策略能够提高系统的查找性能并且可以减少系统的维护开销。在基于全文检索的对等网络平台的设计中,首先考虑了数据索引的放置和定位策略。使用一个平衡树(文档聚类树)来组织对等网络环境中的共享数据,通过调节平衡因子的大小,可以控制和减小文档搜索的时间复杂度;然后,给出一个简单的树节点放置策略,从而保证了系统的负载均衡以及保证了系统的容错性;随后,提出TRES-CORE查询策略,使得每个查询对每个节点只操作一次,降低了分布式环境下的查询时间,避免了查询中的路由绕路问题。另外,使用向量空间模型(Vector Space Model,简称VSM)技术提取全文的数据索引,通常会有成千上万个关键字,对应了成千上万维的特征空间。这些高维的特征集对资源索引的建立是非常有害的。进而,提出了基于粗糙集的文档空间降维技术来提高资源的搜索性能。逻辑拓扑结构的组织方式,是基于全文检索的对等网络平台设计中的另外一个重要研究内容。首先,采用分层的方式给出了一个对等网络资源检索的通用模型,并设计了每层之间的接口。采用分层的结构,可以使得模型具有较强的适应性,当某层策略发生改变时,其它层次的策略可以不变。随后,基于扩展性好、查询效果好、不存在系统瓶颈以及能够支持全文检索的目标,提出了一个半结构化混合模型。在半结构化混合模型中,所有节点根据物理位置分成若干个节点类。每个节点类中存在一个超级节点(Super Peer,简称SP)和若干个普通节点(Ordinary Peer,简称OP)。超级节点采用分布式哈希表(Distribute Hash Table,简称DHT)的方式进行组织,每个节点类中所有的节点以非结构化的方式组织。在这里,半结构是指在系统的构造中同时存在结构化和非结构化的组织方式;混合是指在系统中仍然存在超级节点SP,但此时SP记载用于节点和文档的分类信息,并不维护整个节点类中所有共享文档的索引信息,从而部分解决了SP是系统瓶颈的问题。在最后的实验测试中,可以获知这个设计在能够完成全文搜索的前提下,在资源搜索效率上也有一定的提高。
其他文献
运用WRF中尺度模式对2012年4月12日柳州市出现的一次冰雹强对流天气过程进行了高分辩率数值模拟,较好地再现了冰雹天气发生的热力和动力机制,在此基础上对柳州市北部山脉作降
使用1961~2013年广西80个气象观测站的日降水资料和NOAAOLR、NCEP/NCAR风场、高度场再分析资料。结果表明:当MJO第10位相时广西降水偏多,第1位相时偏少,第2位相时偏多,第3位相时大
采用日本气象厅(JMA)东京台风中心(RSMC-Tokyo)发布的1951~2015年西北太平洋台风最佳路径数据集,对影响中国广东沿海地区的台风进行了统计与分析。结果表明:65年间影响到广东
随着互联网和数字多媒体技术的迅速发展,人们可以通过互联网等各种渠道方便快捷地获得、编辑、复制和传播越来越多的数字音频。这给人们带来了很大便利,但同时也产生了日益严
利用NCEP再分析资料、自动站资料、雷达回波和卫星云图等资料,对强台风“尤特”造成雷州强降水天气过程及其原因进行了分析。结果表明,高层的辐散场为“尤特”的发展提供了十分
(贵州大学机械工程学院,贵州 贵阳 550003)  摘要:在研究生的计算机仿真技术课程教学中,针对机械工程类研究生的专业方向、课程体系的设置以及工科研究生自身特点,为培养研究生的自主学习能力、创新能力以及增强其工程应用意识,通过在计算机仿真技术课程教学的经验积累,逐步探索出以项目驱动为主要教学方法,通过实践应用,取得良好的教学效果。  关键词:项目教学法;计算机仿真;创新;实践  中图分类号:G
作文评改是作文教学的重要环节,它既是对作文教学效果的检查,也对学生如何写作起引导作用。多元化的、创造性的、讲究策略的评价,富有活力的针对性强的评价语言,是习作绿色、
叶片在高速运动过程中产生的大位移,对物体的结构分析和性能评估是非常重要的原始数据,也是目前结构检测的难点和工程界的研究热点。针对叶片在高速运动状态下产生的大位移,