论文部分内容阅读
IaaS云计算资源按需获取、应用执行环境个性化定制的特点吸引着越来越多的组织机构基于云平台技术构建高性能计算集群。高性能计算云平台弹性资源使用模式虽然提高了系统的资源利用率和灵活性,但虚拟化技术同时也引入了系统开销。一旦云平台构建不合理,高性能计算应用将遭受较大的性能损失。为此,需要深入探究适合高性能计算的云平台构建方案,并对其性能进行全面的测试与验证。此外,资源优化配置是制约高性能计算云平台性能发挥的重要因素。其中,虚拟机放置是资源优化配置的关键。然而,当前缺乏对多核CPU感知的虚拟机放置多目标优化策略的研究。本文围绕着高性能计算云平台的设计构建与性能测试、虚拟机优化放置问题,主要开展了以下的研究工作:首先,深入分析了高性能虚拟化技术和高性能计算云平台的国内外研究现状,论证了高性能计算云模式的可行性。通过对比传统云计算与高性能计算云的异同,阐述了高性能计算云的潜在优势和面临的技术问题;对轻量级虚拟化容器技术Docker和云管理系统OpenStack的特点和组成结构进行了深入分析,提出基于Docker+OpenStack的高性能计算云平台构建方案。其次,基于OpenStack和Docker构建了 NUDT_SCICloud高性能计算云平台,并对平台性能进行了测试验证。利用NPB并行基准测试程序和WRF天气预报模式,选取整数和浮点计算、I/O通信、科学计算程序执行效率等性能指标,对真实物理集群和NUDT_SCICloud启动的虚拟机集群性能进行了比较,验证了高性能计算云平台的可行性;对测试结果进行了深入分析,论述了虚拟化对科学应用产生的额外性能开销,指出了 NUDT_SCICloud高性能计算云平台存在的问题和可能的改进方向。最后,针对传统虚拟机放置算法没有考虑物理服务器具有多核计算能力的问题,提出了一种基于多目标优化的多核CPU感知虚拟机放置算法。不同于传统放置算法仅将CPU作为一维资源考虑,该算法将物理服务器多核CPU抽象为多维向量,针对高性能计算云环境下降低能耗、降低SLA违约率和资源利用均衡等3个优化目标,提出基于蚁群优化的多核CPU感知虚拟机放置算法;CloudSim仿真实验结果表明,提出的算法能在多个互相冲突的优化目标之间进行权衡,获得比传统放置算法更好的Pareto占优解。