针对多核体系结构性能调度的研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:JJ415722591
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多核技术已经是现代处理器发展的主流趋势,它的诞生给软件开发技术带来了新的挑战。如何编写出高效的并行程序使之充分地利用多核的资源,这一直是学术界和工艺界致力于解决的难题。多核程序的性能调试对于开发高效的并行程序来说,具有良好地辅助作用。它通过分析程序的行为并诊断其性能瓶颈,进而给性能优化提供有效的支持。   由于并行程序的动态性和不确定性,传统的代码分析技术很难有效地检测其性能瓶颈。有的研究工作提出在软件层分析程序运行时行为,这通常会引入很大的运行时开销,并且获得数据精确度很低。硬件的实现虽然运行时开销低,然而其结构扩展引入的开销又会损伤程序的性能。   本文设计了一种性能监测器PerfMon,它通过扩展Cache结构和Cache一致性协议而实现对多核之间读写共享行为以及对共享Cache的占用和冲突情况的动态监测。对于监测统计的结果,PerfMon以性能计数器的形式反馈给软件层,从而对多核平台上的性能分析工具和动态调度优化提供有效的支持。实验结果表明,PerfMon的硬件扩展引入的结构开销和运行时都很小,并且在平均情况下能够辅助调度优化取得较好的加速比。
其他文献
分数阶微积分是数学研究领域中的一个古老而又年轻的领域,是传统整数阶微积分理论的扩展。迄今为止,对于分数阶微积分理论的研究己经取得了重大成果,这也为分数阶微积分在各学科
随着信息技术的迅速发展,网络安全问题越来越引起人们的重视。接二连三的信息泄露事件不时地提醒人们网络安全问题形势严峻。网络时间隐蔽信道是一种隐蔽性极强的网络隐蔽信
随着信息技术的发展和网络的进一步普及,人们对资源安全的要求越来越高。传统身份认证技术(如用户名和口令)已经无法满足身份认证安全性的需要。因此,人们将目光转投到克服传统身
随着可编程逻辑门阵列FPGA器件成为嵌入式系统设计领域的研究热点,基于FPGA器件的新型动态局部重构技术受到学术界广泛的关注。可重构技术兼顾了系统的性能和设计的灵活性,大
随着计算机网络的发展,国民经济和社会发展对基础信息网络和重要信息系统的依赖性越来越大,信息安全问题日益突出,因此信息安全保障越来越受到全社会的广泛关注。信息系统安全评
随着信息技术的高速发展和信息资源的迅速膨胀,人们从海量数据中找到自己真正感兴趣的信息变得越来越困难,这就是著名的“信息过载问题”。推荐系统一直被认为是解决信息过载
Flash存储器是一种非易失性存储器,以其低成本、低功耗、高访问速度和高抗震性等优点,被广泛运用于便携式设备、消费电子等嵌入式系统的数据存储。不幸的是,和传统块设备不同,Fla
蜂窝概念的提出在无线移动通信发展史上具有里程碑式的意义,将无线移动通信系统划分成互相独立的小区,复用距离之外的小区可以使用同一频谱,使无线移动通讯系统的容量得到了
传统数据挖掘算法,其知识表示方式主要是命题逻辑形式,每一样例以属性-值元组的形式表示,难以表达对象内部之间的复杂关系,并且只能从单一关系中发现模式。但是,大多数现实关
人脸识别技术是计算机模式识别领域非常活跃的研究课题,在法律、商业、公安系统等领域有着广泛的应用前景。由于人脸图像的特殊性与复杂性,人脸识别问题也是模式识别领域的一