面向嵌入式系统的自调数据预取

来源 :浙江大学 | 被引量 : 0次 | 上传用户:yanggh1963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对计算机系统中存在的存储墙问题,现代处理器采用预取技术,利用应用程序中存在的规律性地址访问模式,来对存储访问行为进行预测,以减少高速缓存缺失次数。然而目前工业和学术界的各种预取技术存在以下问题:1)应用程序中存在大量的链表指针模式,而主流商业处理器上的预取引擎只针对线性地址模式进行预测;2)现有的指针预取方法对返回值进行类地址判断,其预取准确率较低,通常在10%以下;3)在多核处理器上数据预取引擎会加剧对共享资源的冲突,进而导致系统总体性能降低。本文开发了一款兼容MIPS32指令集的周期级软件模拟器,来对嵌入式单核/多核处理器的功能、时序和成本三方面进行建模。在该平台上针对上述现有预取技术中存在的问题探索解决方案。根据对应用特性的分析和优化空间探索,提出了用于嵌入式单核处理器的多模式自调数据预取方案。该解决方案根据硬件统计的运行时信息,通过特殊预取指令对两种预取模式的激进度进行自适应调节,通过链式和线性模式判断提高了预取的准确率。在单核软件模拟器上执行EEMBC、 SPEC CPU2006和OLDEN评测程序,结果表明,多模式预取引擎的准确率分别平均为36%,40%和56%,而内容指导(Content direct prefetching, CDP)的指针预取准确率分别为8%,9%和24%,相对流预取、CDP指针预取和GHB预取性能分别提升7%、6%和9%。本文针对多核多线程的应用环境,提出一种线程分类的预取机制,来降低数据预取导致的存储系统资源竞争。提出的多核数据预取机制包括:(1)采用过滤方式通知硬件单元,丢弃预取请求会导致线程间数据无效化的预取。(2)根据运行时信息对线程进行分类,调整各线程数据预取引擎的开关状态和激进程度,从而降低了线程间的资源冲突。在16核系统进行建模,采用PARSEC、SPLASH-2和科学计算程序进行评估,结果表明:相比于基准预取引擎,采用过滤机制和线程分类调整预取策略,系统性能分别可以提升2%和6%。相比将反馈指导预取(Feedback direct prefetching, FDP)技术应用于基准预取引擎上的结果,本文提出的预取机制提升了4%的系统性能,并减少了4%的能量时间积。
其他文献
高压直流输电系统由于在输电距离、传输容量以及经济性上具有显著的优势,目前在跨区域电网间的互联与大容量远距离输电中获得广泛应用。换流器与直流输电线路是高压直流输电系
传统民法理论对于动产和不动产的物权变动公示方式有着严格而明确的区分。动产物权变动以交付为公示方式,不动产物权变动以登记为公示方式。但是特殊动产这一财产形式的出现,由
随着城市改造步伐加快,市政工程建设规模不断扩大,出现大量市政工程企业和人员参加工程建设,但因企业资质不同,企业规模和技术水平差距较大。同时施工纲程实施不规范的现象也
目的 总结 7例肝脏恶性肿瘤活检后肿瘤种植转移的诊断和处理。方法 回顾性分析 6例行原发灶及转移灶切除 ,1例因严重肝硬化伴有多发肝脏肿瘤而无法手术 ,仅行转移部位开放
目的提高药渣纤维的疏水性、药渣纤维与塑料的相容性以及药渣纤维的分散性,从而提高纤维/塑料共混材料的强度。方法以灵芝药渣经机械挤撵破碎、发酵后得到的药渣纤维为原料,
采用IPAT模型框架及岭回归技术,以北京市为例,分析了人口、经济增长、技术水平和经济结构等因素对生态环境的作用机制。主要结论有:(1)北京经济增长和环境质量之间的关系曲线不是
江苏靖江段位于近长江口段,是长江刀鲚渔汛最集中的水域。为了弄清靖江段刀鲚的渔汛特征,本文于2008-2009年和2012-2013年对16艘持刀鲚捕捞许可证的渔船作了渔获量监测,分析