论文部分内容阅读
自从计算机诞生以来,计算机硬件故障和软件错误就不可避免地伴随着。在云计算环境下计算机硬件和软件环境更为复杂,随着处理机数量的增加,故障发生的概率与恢复难度也会随之增加,而故障恢复所需时间越长也意味着更大的损失以及恢复成本。在故障发生后,如何快速恢复故障并降低故障对任务正常执行的影响,是降低云服务用户和云服务供应商损失的关键。本文以云计算模型及多主体系统作为理论基础,研究了基于多主体协作的云节点自愈机制,意在使云节点成为具有自主性、交互性、反应性、主动性的智能主体,从而在节点自愈中发挥更强的作用,加快云服务故障恢复的速度。主要的研究内容包括以下几个方面。首先,针对基于多主体协作的云节点自愈机制所需的各项关键支撑理论进行了分析。先分析了云计算概念及其技术特点,之后介绍了本文中自愈机制的基础——多主体相关技术,分析了其基本概念、特点和协作机制。随后介绍了多主体中需要的两个关键理论。一个是知识与知识库理论,分析了其基本概念和在多主体系统中的具体应用。另一个是KQML通信协议,分析了其基本概念、协议规范以及保留关键字的意义。其次对基于多主体协作的云节点自愈机制进行了研究与分析。先定义了此自愈机制中的相关概念。然后,对于自愈机制的核心——多主体系统的体系结构进行了研究与分析。通过阐述云计算环境无中心多主体系统的缺点,确定了以辅助主体主导建立协作关系的多主体系统,并对其协作机制、知识的学习和传播机制以及多主体间的通信进行了研究并对主体内部的体系结构及其内部各构件的功能进行了分析。最后,对基于多主体协作的云节点自愈机制的云节点自愈构件的实现进行了分析,给出了典型实例,并通过实验验证此构件的有效性。