【摘 要】
:
机群系统的规模增大,部件增多,导致了机群的组合错误率也不断上升。节点失效使运行于机群节点上的作业面临中途失败,从而造成巨大的资源浪费,甚至导致大的作业无法完成。检查
论文部分内容阅读
机群系统的规模增大,部件增多,导致了机群的组合错误率也不断上升。节点失效使运行于机群节点上的作业面临中途失败,从而造成巨大的资源浪费,甚至导致大的作业无法完成。检查点系统为节点提供了较好的容错性能,因此成为机群操作系统软件的重要组成部分。通过建立单机检查点系统可以提高操作系统的可靠性,减少运算损失,同时也为构造其他容错软件,甚至是建立整个机群环境的并行检查点系统提供基础。本文主要针对单机检查点系统的实现技术进行研究,并以曙光4000系列机群为平台,重点讨论了系统级检查点的平台相关性和性能优化策略。曙光4000A中使用的Opteron是基于AMD公司的x86-64架构的处理器。目前还没有开源的检查点系统对该体系结构提供过支持或者相关技术探讨。本文首先分析比较了现有检查点系统,对检查点实现技术进行深入研究,重点讨论了系统级检查点BLCR的实现机制。然后通过对x86-64体系结构的分析,实现了BLCR对AMD Opteron的支持,并对系统级检查点的平台相关性进行了探讨。最后提出了两种检查点系统中进程地址空间的优化存储策略。其中组合式检查点文件写策略解决了并发写机制在应用内存接近物理内存时的性能突降问题,A-O(Access-Order)进程地址空间存储策略调整传统地址空间的存储顺序,使大内存应用的检查点操作性能得到了大幅度提升。实验表明,A-O进程地址空间存储策略最高可以将传统的存储策略的时间开销缩减至原来的50%。
其他文献
智能规划是人工智能一个重要的领域。近年来,有关智能规划的研究在问题的描述和问题求解两方面得到了新的突破,使得智能规划已成为现在一个热门的人工智能研究领域。随着智能
高维索引技术是研究通过建立索引结构来提高高维数据库上检索效率的一门科学。图像数据库作为高维数据库的重要组成部分,其检索离不开高维索引技术的支持,近年来备受研究人员
当前科学技术正进入多学科相互交叉、相互渗透、相互影响的时代,生命科学与工程科学的交叉、渗透和相互促进是其中一个典型例子,也是近代科学技术发展的一个显著特点。进化算
在当今以数据为中心的时代,越来越多的应用需要访问各种异构数据源,特别是对于企业应用来说,这既是企业内部发展的需要,也是企业适应外部环境的需要。XML因其具有自描述性、
实时协同编辑系统是一类重要的CSCW 应用系统,具有实时性、分布性和无约束性三个特点。一致性维护是设计和实现此类系统最具挑战性的一个世界级难题。传统的令牌、加锁、串行
随着微电子技术和移动通讯技术的发展,嵌入式设备和移动终端具有越来越强大的处理能力。这引发了人们要把嵌入式移动终端作为下一代个人工作平台和轻便的移动办公载体的遐想
和传统本地存储相比,云存储因为价格低廉,和管理方便,吸引了越来越多的企业和个人用户倾向将数据外包存储到第三方云中。但是目前云中数据的安全和隐私问题成为阻碍云服务进一步
随着因特网和电子商务的快速发展,引发了企业应用程序可用信息数量和类型的急剧增长,信息集成已经成为当前企业面临的巨大挑战。本文在企业信息集成发展现状研究基础上,将模
随着办公自动化的快速发展,越来越多的人喜欢用电子邮件进行交流。由于人们每天需要处理越来越多的邮件,所以迫切需要对邮件进行分类处理。与此同时,随着机器学习和数据挖掘
本文对LINUX系统安全这方面做的研究。LINUX作为一个现代的操作系统,正在各个方面得到广泛的应用。LINUX在服务器、嵌入式等方面已经取得不俗的成绩,在桌面系统方面,也逐渐