论文部分内容阅读
近几年来,随着闪存技术的不断发展,无论是在桌面应用还是分布式计算领域,基于闪存的固态硬盘(SSD,Solid State Disk)有取代传统的机械硬盘(HDD,Hard Disk Drive)的趋势。然而,在企业应用中完全用SSD来替换HDD作为主流的存储系统设备还有很长一段路需要走。考虑到SSD的成本、性能以及可靠性,将SSD和HDD结合构成混合式存储系统是一种在实践中可行的方法。提出了一种混合式存储系统―性能-可靠性-混合式存储系统(PR-HSS,Performance Reliablity-Hybrid Storage System),在I/O性能和可靠性之间得到一个折衷,PR-HSS由一块高性能的SSD和一块传统的HDD来存储镜像数据来保证可靠性,所有的I/O请求的数据经过PR-HSS后首先都会重定向到SSD,然后根据特定的备份策略将数据异步地从SSD备份到HDD。为了削弱或者隐藏数据拷贝所带来的延迟开销,使用一个I/O窗口来吸收写请求并且维护一个I/O请求队列的元数据集合,该请求队列是有序的,这样可以减少HDD的寻道时间,提高系统整体性能。为了适应不同的I/O负载,设计并实现了一种动态自适应的策略来平衡前端应用层的I/O请求以及后端备份的请求。在Linux操作系统内核中实现了一个原型系统PR-HSS,并用标准的基准测试程序IoMeter、PostMark以及TPC-C进行了全面的测试。结果表明在IoMeter和PostMark的负载下,PR-HSS相对于RAID1在性能上提高了10倍,数据可靠性仅仅降低了2%。另外,在TPC-C测试程序下,PR-HSS性能并没有得到提升,但是相对于HDD组成的RAID1来说,其能满足更大规模数据集的应用。通过使用熵理论对IoMeter、PostMark以及TPC-C的I/O负载的时间请求序列进行突发性分析发现,TPC-C相对于IoMeter以及PostMark有更多的空闲时间来让PR-HSS进行后台备份。