基于神威平台的生物数据库混合序列比对算法研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:dama5011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在生物信息学研究中,生物序列比对是其基本组成和重要基础。序列比对的基本思想是基于生物学中序列决定结构,结构决定功能的普遍规律,将核酸序列和蛋白质一级结构上的序列都看成由基本字符组成的字符串,目的是找出序列之间的相似性,发现序列之间的内在联系,进一步探索生物序列中的功能、结构和进化的信息。如今随着生物数据库规模的爆炸性增长,序列比对过程的复杂性也迅速增加,导致计算时间的大量增加。为加速生物数据库的搜索过程,通常在大规模超级计算机上进行。“神威·太湖之光”是世界上第一台性能峰值超过100 PFlops的异构超级计算机,其完全采用国产异构众核处理器SW26010处理器构建而成,为生物数据库搜索提供了一个全新的硬件平台。到目前为止,已经有许多高性能应用在神威平台上进行了移植优化并取得了很好的加速效果,其中不乏一些优秀应用获得高性能应用领域杰出奖项——戈登贝尔奖。但由于神威平台特殊的片上异构众核体系结构,现有的序列比对算法无法直接在神威平台的从核集群上进行移植加速。本文提出了一种基于国产众核平台的混合序列比对生物数据库搜索算法,即针对序列比对生物数据库搜索程序的核心——序列比对算法,融合Smith-Waterman(SW)局部比对算法和Needleman-Wunsch(NW)全局比对算法提出混合序列比对算法对生物数据库进行搜索,并通过消息传递接口(MPI)和加速线程库(Athread)进行实现。为充分发挥SW26010处理器的性能,根据申威众核体系架构的硬件特性以及混合比对算法的软件特点,分别从编译优化、众核访存优化以及负载均衡等方面对移植后的算法进行优化,有效地提升了算法的运行效率。采用EBI(European Bioinformatics Institute)维护的蛋白质序列数据库Swiss-Prot对算法分别进行了单节点和多节点测试,实验结果表明,该算法可以有效地利用SW26010处理器的特殊硬件架构,在单个节点上与申威主核版本相比实现了最大15.92的加速比,相比Intel Xeon E5620平台也实现了 4.33倍的加速。此外,本文在“神威·太湖之光”平台上对并行算法进行多节点测试,当使用64个节点时,所提算法的加速比超过1000倍,结果表明,本文提出的混合序列比对生物数据库搜索算法的并行实现具有良好的可扩展性。
其他文献
随着视频监控软硬件和人脸抓拍技术的迅速发展,人脸数据在迅速增加。如何对人脸大数据进行聚类分析,提取出有价值的知识,是当前研究急需解决的一个问题。论文针对该问题展开,
近几十年,有许多工作对NGEO卫星网络进行了研究,因为其相对于GEO卫星具有轨道低、时延小、地面终端设备功率要求低等优势。然而随着卫星通信技术的发展,迅速增长的地面用户流
随着科技的发展,人们对社会的需求越来越高,各种用电设备越来越普及,从而增加了建筑能耗。对此,为了实现实时监测与控制楼宇中用电设备的运行状态以及获取用电设备的运行参数
由于不断发展的科学技术和不断深入的信息化建设,现代网络的规模已经越来越大,到了不能忽略其能耗的地步。据估计,现在信息通信技术(ICT)中的能耗约占全世界各类能耗的1-2%,
作为中国证监会最早批准的创新试点资格的券商和综合类券商,华泰证券股份有限公司经过20多年的不断发展壮大,现已经成功在上海(代码:601688)和香港(代码:HK6886)挂牌上市。华
本研究通过室内抑菌试验,筛选出对新疆棉花苗期主要根腐类病害立枯病和红腐病的致病菌活性较好的杀菌剂,并通过筛选悬浮剂、增稠剂、成膜剂等助剂及种衣剂加工工艺研究,制备
随着首次公开上市发行的再次重启,我国上市公司的数目不断增长,上市公司重组的事件也随之呈增长的趋势。而反观重组的绩效,受制于样本选择的差异和研究角度、方法的不同,一直
伴随着通信技术的飞速发展,大量诞生于不同应用场景的无线通信技术不断涌现出来,同时由于移动互联网的高速发展,使得单一制式的网络无法满足用户日益增长的业务需求。随着多
在高性能处理器领域,受到功耗、互联及复杂度三大因素的限制,处理器计算性能的增长速度已经无法满足摩尔定律,异构并行的加速方式将引领新的发展方向。在嵌入式领域,ASIP技术
目的:研究催眠术在局麻手术中的应用,并探讨催眠术在局麻手术中应用的安全性、可行性。证明催眠术可有效地辅助局麻,达到满意效果,提高患者手术麻醉的舒适性。方法:研究取得所有患者知情同意,且通过天津医科大学肿瘤医院伦理委员会批准,2017年8月至2019年6月,选择在天津医科大学肿瘤医院进行乳腺肿瘤切检手术的患者,患者均愿接受催眠治疗且为催眠易感患者,根据斯坦福催眠感受性量表筛选出催眠易感患者,患者均为