论文部分内容阅读
近年来,随着信息技术的快速发展,计算需求日益增加,计算成本不断提高,集群技术凭借其在计算方面高性价比的优势,在各应用领域得到了广泛的认可。然而,在集群技术被普遍使用的同时集群规模也不断扩大,集群管理问题逐渐凸显。集群频繁的拓扑更新和集群节点的物理分散性,加大了集群节点统一管理的难度,提升了管理成本,并对集群管理系统的数据安全性和一致性提出了巨大挑战。因此,如何在合理控制管理成本的前提下,保证集群管理的可靠性和高效性成为了一个重要的研究课题。针对当前集群管理系统的不足,本文基于分布式协调服务设计并实现了一个集群管理系统。该系统允许用户通过Web页面对集群状态进行实时监控,执行与集群逻辑划分相关的组织管理操作。本文首先对集群管理系统进行了需求分析,其中,功能需求包括节点监控、节点管理和群组管理三部分,并且从个性化设计及易用性两方面对系统界面需求进行了描述。然后,设计了系统的物理结构和部署结构,划分了系统功能层次,说明了系统数据存储设计,并对系统进行模块划分,给出了节点监控模块、节点管理模块、群组管理模块和Web应用模块的接口设计。接着,通过图示和表格的方法描述了系统数据模型的设计与实现,对各模块中功能的服务流程和代码实现进行了逐一阐述。最后,论述了系统的软硬件测试环境、实际部署步骤和相关测试工作。本文设计的集群管理系统利用分布式协调服务在数据管理方面的高容错性和高一致性,实现了可靠的数据服务。与此同时,系统采用管理业务接口与用户交互接口分离设计的方法,将管理业务封装成Agent服务,用户交互业务封装成Web应用,两者协同工作对外提供集群管理服务,有效地减少了冗余开发,控制了管理成本。