基于GPU的字符串核函数并行实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:sherry77677
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
字符串相似性匹配是计算机领域最基础的技术之一,被广泛应用于网络安全、信息检索等领域,同时还被广泛应用于生物学信息处理,文本词根识别等应用。然而随着网络发展的日新月异,网络数据流量成倍增加以及匹配要求从精确匹配到模糊匹配的日益复杂。字符串的匹配处理速度慢,不足以适应当今大规模数据集任务的要求,迫切需要提出新的更有效以及质量更高的算法来满足大规模数据集的处理需求。当今GPU(图形处理器)更新换代提速,GPU功能越来越强大。NVIDIA公司于2007年推出CUDA(Compute Unified Device Architecture)架构,使显卡用于解决图像计算以外的任务。CUDA这一新的基础架构可以用来解决工业、商业以及科学计算方面的复杂问题。采用CUDA具有众多优点:便宜的价格,高效并行性,高密集运算,超长流水线。现在CPU+GPU(中央处理器+图形处理器)异构处理平台已逐渐成为主流的并行解决方案。本文旨在利用CPU+GPU异构处理平台的高效并行能力,更为有效的进行大规模数据集处理。本论文首先概述基于字符串核函数的SVM(支持向量机)的广泛应用及面临的挑战,同时论述了GPU的架构特点以及NVIDIA推出的专用平台CUDA(the Compute Unified Device Architecture,计算统一设备框架),详细论述了CUDA中线程的调度、内存的种类以及分配和充分发挥GPU计算能力的原则,并回顾了国内外基于CUDA的字符串处理研究。其次本文对经典的字符串核函数算法一一编辑距离核函数(Edit Distance Kerne)、p频谱核函数(P-spectrum Kernel)、序列间隔加权核函数(Gap-Weighted Subsequence Kernel1一一进行了GPU并行优化,结合CPU+GPU异构平台的特点将上述核函数算法使用CUDA平台并行化向GPU移植。使用Reuters-21578和SpamAssassin公共语料库对本文的gpuSKSVM进行评估,三种核函数的计算获得了比原系统7-33倍的速度提升。
其他文献
随着互联网技术的发展,安全问题变得越来越突出。在众多的信息安全问题中,隐蔽通道作为一种新的信息泄露手段,受到了科研人员的广泛重视。然而现有安全防护系统和设备并不能
计算机网络在满足人们快捷的共享资源的同时,也频繁的受到攻击和非法的访问,网络安全问题受到了广泛的关注。入侵检测系统是一种主动的安全防护技术,作为网络安全中一个重要的研
近年来,信息化系统在企业、学校等组织中的应用规模不断扩大。如何解决随着信息化系统规模扩大而带来的各种流程控制问题是一个需要研究的课题。本文以高校信息化系统开发过
随着我国工农业生产和经济建设的快速发展,环境污染事故,不论在发生次数还是污染危害程度上都有逐年增加的趋势。利用信息技术辅助人们完成对环境污染事故的防治,是国内外信息技
随着移动通信和宽带无线接入技术的迅猛发展,未来的无线网络将不再是某种技术一统天下,而是多种无线接入技术共存、相互补充的异构网络。而垂直切换是异构网络切换管理的研究重
近几年,越来越多的新型嵌入式系统需要高性能、高集成度的处理器来满足其相关的嵌入式设计约束,例如减小系统的物理尺寸或者降低功耗。在这种情况下,多处理器片上系统(Multip
近年来,随着数字媒体技术的迅猛发展和信息量的急速膨胀,在大规模科学计算可视化、军事仿真、虚拟现实、工程设计、展览展示和数字影院等诸多应用领域,人们对显示技术的要求
现代制造业竞争日益激烈,旧的生产模式已经无法适应现代化生产的要求,大规模车间调度问题的研究已经成为当前的热点。但是车间制造系统内容复杂、范围广泛,很多领域的研究还很薄
当前,节能减排是时代的主题。随着社会经济的发展,IT行业已经逐渐渗透到了社会建设的各个层面,各个行业,成为其他行业发展的基石和依赖。工T行业蓬勃发展的同时,其能源消耗的
在信息化大浪潮席卷全球的今天,互联网获得迅速发展。网络信息已经应用在国家和社会的各个部门,人们在进行资源共享的同时,也感受到信息安全问题日益突出。如何保证网络信息安全