面向GPU的并行稀疏对角矩阵矢量乘算法研究及应用

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:kawwq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
稀疏矩阵结构存在于众多科学学科中,且在线性代数、数据挖掘和图形分析等领域具有广泛应用。稀疏矩阵矢量乘在计算科学领域中具有重要意义。随着通用图形处理单元GPU编程模型和开发工具链的成熟,面向GPU加速稀疏矩阵矢量乘已得到研究者们的广泛关注。稀疏对角矩阵是一类特殊的稀疏矩阵,其非零元素大多都集中在少量对角线上。DIA格式是最适合用来存储稀疏对角矩阵的存储格式,然而,当稀疏对角矩阵中的对角线存在长断行、长偏移或者散点等情况时,如果继续采用DIA去存储,将引起大量零元素填充,导致DIA核的性能大大下降。稀疏块对角矩阵也是一类特殊的稀疏矩阵,其非零元素结构呈现块对角形态。显然,DIA格式不适用存储此类矩阵,CSR和ELL格式虽然能有效存储,但由于没有利用其对角结构,其核的性能并不好。为此,本文从两类矩阵出发,基于GPU编程模型CUDA,深入研究面向GPU的稀疏对角矩阵矢量乘算法。本文的主要工作和贡献如下:1.提出了基于GPU的自适应并行稀疏对角矩阵矢量乘算法DIA-Adaptive。针对稀疏对角矩阵的对角线存在长偏移、长断行以及少量散点情况,首先,依据一定规则将矩阵分为三类;进而基于这些分类,除第一类采用原有的DIA算法外,其余两类,分别提出新颖的BRCSD-I算法和BRCSD-Ⅱ算法与之相对应;最后,还设计了一个搜索引擎和代码自动生成器,任一稀疏对角矩阵经过搜索引擎可自动识别类型,选择合适的存储格式,并自动生成对应内核。实验证明,本论文提出的DIA-Adaptive算法是有效的,具有较高的性能和良好的并行性。2.提出基于GPU的并行稀疏块对角矩阵矢量乘算法IndexBDIA。针对一类稀疏块对角矩阵,利用其块呈对角结构,先将稀疏块对角矩阵划分成许多个某一尺寸大小的小矩阵块,并记录每一小矩阵块对应的行列索引值;进而通过行列索引值找出块对角线,块对角线的建立大大减少了行列索引值的存储;最后,根据块对角线偏移值对矩阵进行行断划分存储,有效减少了块对角线存在大偏移时所需要的零元素填充。实验证明,提出的IndexBDIA算法性能较好。3.应用求解Klein-Gordon-Schrodinger(KGS)方程,验证本文提出的算法的有效性。针对离散2D和3DKGS方程后得到的稀疏对角线性系统,基于GMRES算法,将本文提出的自适应稀疏对角矩阵矢量乘算法引入,设计了一种新颖的GPU加速的时间域GMRES算法T-GMRES。实验证明,本文提出的算法应用于求解2D和3D KGS方程是有效的。
其他文献
胡克最初是菲律宾共产党在抗日期间组织成立的抗日武装,二战后胡克为了要求农业改革和反抗政府的暴力镇压,发展成为反政府的胡克运动。胡克运动迅速发展的背后反映了菲律宾严
在化学生产以及生物制药过程中,随着化学反应的不断进行,晶体的形貌会发生不断变化,为获取理想的产物,需要对晶体结晶过程进行监控,获取晶体在反应过程中的各种生长信息以控
信息时代,摄影作为一种记录媒介,已经逐渐成为人类观看方式的延伸并渗透进了我们的日常生活。摄影术诞生至今短短的一百多年间,我们的社会已经积累了无数的照片。从传统摄影
随着基因测序技术的发展,基因数据呈现出迅猛增长的趋势,在这种情况下,通过生物学实验方法发现相似基因效率比较低,而基于异质网络结构研究基因相似性搜索算法已经成为生物信息学研究的热点。在基因-疾病-表型形成的异质网中,挖掘疾病、表型间潜在的关联信息、合理量化节点间链接权重对基于pathSim算法探究基因相似性起到了至关重要的作用。然而,现有研究在基于pathSim算法探究基因相似性时很少考虑以上两个因
随着云存储技术的发展,越来越多的用户选择将自己的数据存储在云端。因此,云存储服务的易用性与安全性面临更多的挑战。为降低用户对数据安全性的担忧,云服务商所提供服务需要满足更高的安全标准。为保护用户数据的隐私,云端存储数据通常需要进行加密处理。然而,传统的加密算法会隐藏数据的大部分信息,所生成密文难以实现搜索比较等操作。因此,可搜索加密技术应运而生。为提高密文搜索算法的灵活性与安全性,本文对不可信环境
蛋白质相互作用(Protein-Protein Interaction,PPI)网络是指一个生物体内的所有蛋白质之间相互作用组成的网络。蛋白质功能模块是指PPI网络中通过相互作用完成某一特定生物功能的蛋白质集合。在PPI网络中挖掘蛋白质功能模块是蛋白质组学研究的一个重要内容,它不但有助于人们从分子水平上理解生命的运行机制,而且对于疾病诊断和研发新药具有十分重要的意义。因此,为了有效地检测出PPI网
密码键盘作为一种特殊的密码输入工具,在日常生活中得到广泛应用。但是,传统的手机密码键盘不能抵挡涂抹攻击和肩部攻击,因此不能保护用户的隐私。基于以上问题,本文提出了一种自适应混合图像的防窥视密码键盘。主要实现的功能如下:第一,用户看到不同距离的不同数字图像信息。第二,可以根据距离动态改变图像效果,并实现用户需求的自动调整。第一个功能通过混合图像实现,第二个功能通过模糊逻辑和自适应等技术实现。针对上述
“连A带B”结构是现代汉语中的常见结构,其以简洁的形式,生动的描写,丰富的表达,在口语和书面语中使用频繁且应用广泛。以往的研究多注重对结构形式上的描写以及对语义语用的研究,而从构式角度关注较少,缺少对结构形成动因与机制的探索,这一点值得我们继续挖掘。因此,本文是以框架构式“连A带B”为研究对象,主要借助三个平面的语法理论,配以语法化理论、认知语言学、构式理论等其他相关理论为指导,通过描写、解释、归
近几年,中国经济处于转型阶段,十九大报告明确提出要激发和保护企业家精神,鼓励更多的社会力量参与创新、创业;鼓励创业兴就业;鼓励高校毕业生、农民工等青年群体多渠道就业
随着通信技术的不断发展,各类新型互联网业务近年来也是发展迅猛,互联网上内容发生了日新月异的变化,直播、小视频、互联网电视等内容的兴起更是有力的冲击了传统的互联网行