Intel MIC架构上不同编程模型性能研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:intint
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Intel MIC协处理器作为近年来一种新的异构计算平台,由于其基于现有的X86架构的特点,同时支持OpenMP、OpenCL、pThread等多种并行编程模型,越来越多地被应用在高性能计算领域。不同并行编程模型对具体应用的并行效率有所不同,针对具体的应用,结合Intel MIC平台的特点,选择合适的并行编程模型,尽可能地提高并行效率已经成为一个亟待解决的现实问题。本文结合实际研究中图像处理的相关应用,在Intel MIC平台上,分别利用OpenMP和OpenCL两种并行编程模型对非局部均值图像去噪算法和免疫优势克隆选择算法进行了并行化,并对两种编程模型在Intel MIC平台上的并行性能进行了研究。本文所研究的主要工作有以下几个方面:(1)通过对非局部均值去噪算法的分析,在Intel MIC架构上提出了基于OpenMP和OpenCL的并行非局部均值去噪算法。在算法中,将每个像素的去噪过程放在MIC核的一个线程上执行,实现串行算法的并行化,之后与串行算法进行对比,利用去噪后图像的PSNR指标,验证了两种并行算法的有效性和正确性。研究了不同的搜索窗和相似窗大小,对两种并行算法的去噪性能和加速性能的影响。分析了基于OpenMP的并行算法在卸载模式下,不同线程数对并行性能的影响,为了进一步提高并行算法的性能,结合MIC平台的特点,通过SIMD指令对其进行优化,之后研究了并行算法在原生模式、卸载模式和经SIMD优化后的卸载模式下的并行性能,最高获得了47倍的加速比。研究了不同网格划分对基于OpenCL的并行算法的并行性能的影响,对OpenCL平台初始化时间和kernel计算时间进行了分析,最高获得了56倍的加速比。最后与基于OpenMP的并行算法,在Intel MIC架构上的性能进行了比较分析。(2)针对免疫优势克隆选择算法应用于图像特征选择比较耗时的问题,对串行算法中克隆、交叉变异、亲和度计算、选择等多个算子进行了并行化,提出了在Intel MIC架构上的基于OpenMP和OpenCL的并行免疫优势克隆选择算法。通过与串行算法从分类精确率、特征子集维度和算法收敛趋势三个方面进行了比较,验证了两种并行算法的有效性和正确性。研究了基于OpenMP的并行算法在卸载模式下,不同线程时的加速性能,之后分析了基于OpenCL的并行算法的初始化时间和kernel计算时间,最后在Intel MIC架构上对基于OpenMP和OpenCL的两种并行算法的性能进行了比较分析。本文的研究得到了国家自然科学基金(No.61303032,No.61672405)、西安电子科技大学基本科研业务费资助项目(No.BDY121427,No.JB160209)的资助。
其他文献
随着科技的发展,人们对社会的需求越来越高,各种用电设备越来越普及,从而增加了建筑能耗。对此,为了实现实时监测与控制楼宇中用电设备的运行状态以及获取用电设备的运行参数
由于不断发展的科学技术和不断深入的信息化建设,现代网络的规模已经越来越大,到了不能忽略其能耗的地步。据估计,现在信息通信技术(ICT)中的能耗约占全世界各类能耗的1-2%,
作为中国证监会最早批准的创新试点资格的券商和综合类券商,华泰证券股份有限公司经过20多年的不断发展壮大,现已经成功在上海(代码:601688)和香港(代码:HK6886)挂牌上市。华
本研究通过室内抑菌试验,筛选出对新疆棉花苗期主要根腐类病害立枯病和红腐病的致病菌活性较好的杀菌剂,并通过筛选悬浮剂、增稠剂、成膜剂等助剂及种衣剂加工工艺研究,制备
随着首次公开上市发行的再次重启,我国上市公司的数目不断增长,上市公司重组的事件也随之呈增长的趋势。而反观重组的绩效,受制于样本选择的差异和研究角度、方法的不同,一直
伴随着通信技术的飞速发展,大量诞生于不同应用场景的无线通信技术不断涌现出来,同时由于移动互联网的高速发展,使得单一制式的网络无法满足用户日益增长的业务需求。随着多
在高性能处理器领域,受到功耗、互联及复杂度三大因素的限制,处理器计算性能的增长速度已经无法满足摩尔定律,异构并行的加速方式将引领新的发展方向。在嵌入式领域,ASIP技术
目的:研究催眠术在局麻手术中的应用,并探讨催眠术在局麻手术中应用的安全性、可行性。证明催眠术可有效地辅助局麻,达到满意效果,提高患者手术麻醉的舒适性。方法:研究取得所有患者知情同意,且通过天津医科大学肿瘤医院伦理委员会批准,2017年8月至2019年6月,选择在天津医科大学肿瘤医院进行乳腺肿瘤切检手术的患者,患者均愿接受催眠治疗且为催眠易感患者,根据斯坦福催眠感受性量表筛选出催眠易感患者,患者均为
在生物信息学研究中,生物序列比对是其基本组成和重要基础。序列比对的基本思想是基于生物学中序列决定结构,结构决定功能的普遍规律,将核酸序列和蛋白质一级结构上的序列都看成由基本字符组成的字符串,目的是找出序列之间的相似性,发现序列之间的内在联系,进一步探索生物序列中的功能、结构和进化的信息。如今随着生物数据库规模的爆炸性增长,序列比对过程的复杂性也迅速增加,导致计算时间的大量增加。为加速生物数据库的搜
无线传感器网络是由大量传感器节点通过无线通信方式形成的一种多跳、自组织网络。为了保持监测对象的高保真度和原始数据的实时连续性,监测区域内的传感器节点会不间断地采