SpMV的自动性能优化实现技术及其应用研究

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:you0tmd1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在科学计算中,稀疏矩阵向量乘(SpMV)是一个十分重要且经常被大量调用的计算内核.由于SpMV一般实现算法的浮点计算和存储访问次数比率非常低,且其存储访问模式极为不规则,其实际运行性能往往很低.通过采用寄存器分块算法和启发式分块大小选择算法,将稀疏矩阵分成小的稠密分块,重用保存在寄存器中向量x元素,可以提高该计算内核的性能.剖析和总结了OSKI软件包所采用的若干关键优化技术,并进行了实际应用性能测试.测试表明,在实际应用这些优化技术的过程中,应用程序对SpMV的调用次数要达到上百次的量级,才能抵消由于应用
其他文献
由于学习倦怠对大学生学习及思想和心理的发展都产生了很大的消极影响,所以了解大学生的学习倦怠情况对防止大学生产生学习倦怠以及为学习倦怠制订有效的干预策略具有重要意
临床教学是高等中医教育中医类专业教学的重要环节。中医高等教育经过多年发展已形成一定规模,但随着科学技术的发展,传统的师承式中医教育模式[1]存在明显的局限性。中医学
广西右江河谷地区农耕条件优越、人口密集,其村庄特征鲜明,并受到城镇化的影响。文章以广西右江河谷的城厢、凤凰等村庄为典型案例,就其村庄规划的典型问题进行剖析,并对其在