论文部分内容阅读
网格环境中的资源是分布的、异构的、数量庞大而且随机变化的,网格节点可能随时加入和离开网格环境,这些特性会导致资源和任务运行信息的频繁采集,大量消耗节点资源,也容易导致网格任务调度时被分配给无效的节点,严重影响网格任务调度的执行效率。所以构建一个灵活高效的网格资源监控系统,监控节点资源和在其上运行的网格任务的资源消耗信息,是网格计算中重要的环节。校园计算网格是利用校园网内的计算资源构建的计算网格,为校园环境内的各种研究工作提供高性能的计算能力。校园计算网格(UCGrid 3.0)的核心技术是基于GT4开发的计算网格分布式中间件,并以此为基础建立了校园计算网格门户,提供了校园计算网格运行的各种功能。校园计算网格可以解决校园内很多资源没有充分利用而同时有很多任务得不到相应资源的问题。建设校园计算网格的关键技术之一是解决资源监测问题。资源监测为校园计算网格提供必要的与资源有关的性能数据,是资源发现和资源分配的基础。本文以校园计算网格平台UCGrid3.0为监控对象,设计并开发了校园计算网格监控系统,包括校园计算网格监测门户和校园计算网格监控器。以往的研究仅限于资源监测方面,本文研究的监控系统包含监测和控制两个方面,提出了对校园计算网格全面的监控方案。校园计算网格监测门户是对校园计算网格中的各种资源的实时监测平台,提供了对CPU、内存、硬盘、网络流量等各种静态和动态的资源信息的实时监测并通过图形化方式展现。为了弥补GT中MDS组件对资源信息监测的全面性和实时性方面的不足,校园计算网格监测门户引入了Ganglia监控框架,基于Ganglia二次开发。监测门户通过与gmond组件进行通信,将gmond收集的网格资源实时信息通过web页面的方式展现,同时将实时资源信息写入到MDS和数据库中。校园计算网格监控器CGAMS可以监控校园计算网格中间件、GT网格环境、网格数据库等,为校园计算网格的持续正常运行提供保障。CGAMS分为中心控制端和信息反馈端,分别部署在校园计算网格的中心节点和各分节点上,两端之间通过基于Socket的异步通信机制进行通信。其中中心控制端提供对中心节点上的校园计算网格中间件和GT组件的监控,并接收信息反馈端发送过来的GT组件运行的状态信息,同时中心控制端还可以恢复分节点的GT组件重新正常工作。CGAMS采用多线程技术开发,确保了在同一时间可以并发完成各种不同的功能。由校园计算网格监测门户和网格监控器组成的校园计算网格监控系统,不仅可以实时地监测网格环境中的各种资源信息,同时还可以控制与校园计算网格相关的各种组件,为校园计算网格提供了一个集监测和控制于一体的全面资源监控解决方案。校园计算网格监测门户和网格监控器CGAMS分别在已有的校园计算网格环境中进行了部署。在运行过程中该监控系统取得了良好的效果,不仅为网格资源的调度提供全面的数据支持,同时也可保障校园计算网格的持续正常工作。