支持推测并行化的可扩展事务存储体系结构设计与性能评价

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:luoqiaoshui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
片上多核作为当今处理器设计的主流技术,依赖多线程应用来充分发挥性能优势。但是传统的并行编程在编程效率与正确性方面却存在问题,严重制约了对多核平台上大量计算资源的利用。事务存储与线程级推测技术分别从显式并行编程的同步与串行程序的并行化两个方面入手解决传统多线程编程的困难。它们均通过激进地并行执行来充分挖掘程序中更多的并行性,并利用硬件进行动态数据依赖检测以保证结果的正确性、简化编程。现有的研究往往仅专注于其中一种技术,通过复杂的硬件结构来获取有限的性能提升。尤其是现有的线程级推测方案,大都使用了紧耦合的结构设计与复杂的缓存机制。本文通过从这两种技术的语义模型中抽取出共同特征,尝试设计一种具有较好可扩放性并易于实现的硬件支持方案,在其上可以高效地支持推测并行与手工并行,为程序员提供丰富的语义支持以简化并行编程的复杂度。本文在事务存储与线程级推测技术的统一硬件支持方面展开了深入系统的研究,主要的研究成果包括:(1)提出了支持推测并行化的可扩展事务存储抽象硬件结构模型LogSPoTM,并为该抽象模型提供了一个易于硬件实现的方案及其配套软件环境。在这套推测系统上并行化程序执行需要调整的代码很少,达到了简化并行编程的目的。(2)选取若干个具有不同访存行为模式的典型应用程序,对影响LogSPoTM实现方案性能的关键因素进行了详细的评估,分析了一些设计选择对LogSPoTM实现复杂度与性能的影响。(3)针对软件模拟器速度缓慢给研究工作带来的限制,本文最后基于HAsim硬件模拟框架,设计了LogSPoTM的硬件模拟环境,可以将模拟速度提高2~3个数量级。与一般的硬件原型系统的仿真验证环境设计不同,这里的硬件模拟环境是一个高度可配置的研究型模拟器,具有良好的可观测性。在设计评测LogSPoTM结构模型与配套支持系统的过程中,我们得到了一些关于如何有效利用线程级推测技术的认识。首先,为了提升推测执行性能,我们认为更多的努力应当投入到软件优化方面,而不是激进地调整硬件结构和执行机制。利用编译器识别应用的依赖特征、访存模式与迭代粒度等特性,对代码变换的优化应可以起到较好的效果。其次,线程级推测只在部分应用程序上获得最佳的效果,因而并不能让自动并行完全取代手工并行,但可以作为手工并行的辅助工具来使用。
其他文献
在视频点播(VOD)系统中采用P2P技术,通过节点间相互协作可以有效提高整个系统的服务能力。现有的P2P VOD系统网络结构主要分为树形和mesh形,树形又可分为单树和多树。单树结
随着当今高性能计算与通信技术的发展,空间信息技术已经逐渐地发展成为一个影响军事发展、经济建设、国家安全、社会进步等国家活动和民众生活各个方面的高新技术产业领域。
AGV(Automated Guided Vehicle)即自动导引车是一种自动化物料搬运设备,它具有自动化程度高、应用灵活、安全可靠、无人操作、施工简单及维修方便等诸多优点,因而广泛应用于
交通运输是国民经济发展的命脉,其中高速公路又以其快速、便捷的方式对国家的经济、社会和文化等方面产生着巨大的影响。近年来,随着高速公路路网建设的迅速发展,交通量不断
序列比对是生物信息学中一项重要的基础性研究课题,它的最基本任务之一是进行多序列比对,多序列比对可用于蛋白质的功能域识别、二级结构预测、基因识别以及分子系统发育分析
在下一代视频技术中,立体视频作为一种比普通视频提供更多信息内容和具有更多数据量的数字媒体,因其具有强烈的立体感和纵深感特性越来越受到人们的关注。立体视频蕴含了景物
随着Web资源的急剧膨胀,用户已经很难从中找到所需的资料。搜索引擎,正是为了满足大众的信息检索需求,应运而生,并已成为人们日常生活中必不可少的工具。   但是,现有搜索引擎
为了解决由于Internet的开放性所引起的信息传递安全问题,Netscape公司提出了安全套接层协议,为客户端和服务器之间通信提供信息保密、信息完整和相互认证等服务,防止通信信
随着3G时代的到来,手机电视也越来越引人注目。在此背景下,我国广电总局提出了具有自主知识产权的民族标准CMMB(ChinaMobile Multimedia Broadcasting)。CMMB的物理层信道采
客户关系管理(CRM)是一种旨在改善企业与客户之间关系的新型管理机制,它可以通过提供优质服务吸引和保持更多的客户,并通过对业务流程的全面管理降低企业的成本。 本论文首先