论文部分内容阅读
文件系统或裸设备被广泛使用在各种关键的集群系统中。随着应用对可用性要求越来越高,这两种技术都暴露出一些缺点。文件系统有两个主要问题。第一,冗余问题,既任一时刻它只允许一台主机访问,可以使用热备份软件来切换资源,但是切换的时间段内应用也无法访问数据。第二,性能问题。除一台主机外,集群内的其它主机资源被浪费。裸设备可在多机间共享,冗余性和性能得到了提高。但它也有一些缺点。首先,裸设备在任何一台主机上被修改后,其它主机必须进行信息同步,这需要停止I/O访问。第二,为了消除I/O访问的“热点”,裸设备使用前需要仔细规划。即便如此,当存储扩容时还是需要停止I/O访问并在扩容后重新进行规划以保障性能上的平衡,这在管理方面和可用性方面都是很不利的。本文由此展开。首先,介绍了并行文件系统的相关概念,由于它允许多机同时访问,克服了普通文件系统和裸设备的缺点,而集中了二者的优点。第二,介绍了新的基于并行文件系统集群的实施过程,分析了各子系统的高可用性实现方式。第三,提出了用于可用性指标测试的算法。第四,进行了实验测试和可用性指标的对比,验证可用性的有效提升。