K单体型重建算法的研究

来源 :广西师范大学 | 被引量 : 1次 | 上传用户:xiansong2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着新一代基因测序技术的飞速发展,以及单体型数据在人类遗传学等领域研究和应用的不断深入,对单体型数据的研究开始转向其他生物物种。由于测序技术的限制,通过生物学实验的手段直接测定单体型的代价过于昂贵,因此,基于DNA片段数据的单体型组装技术的研究仍然是这些应用得以大规模推广的必要手段。由于许多其他物种的单体型个数均大于2,现有求解二倍体单体型的算法无法应用于这些物种的单体型组装,因此研究适用于这些物种的K单体型组装算法具有重要的科学研究价值和现实意义。本文针对K单体型组装算法进行研究。论文首先介绍了K单体型组装问题的相关背景知识和研究意义,阐述了其研究现状和进展。K单体型计算问题可分为K值已知和K值未知两种情况。本文分别对这两种情况的计算问题进行研究,提出了基于遗传算法的求解方法,并通过大量的实验对算法进行性能分析。具体内容如下:针对K值已知的情况,对K值取3的三倍体单体型重建问题进行了研究,基于最少错误更正模型,提出了重建三倍体个体单体型的遗传算法GTIHR。算法采用了新颖的染色体编码方法和有效的遗传算子,其较短的染色体编码方式能够构造较小的解空间,从而使得算法快速收敛到最优解,此外,提出的遗传算子通过对染色体注入随机信息而避免早熟现象,并在优化过程中,有效地利用SNP片段中的信息来逐步修正染色体编码取值。由于真实的DNA片段数据一般很难得到,实验采用鸟枪法测序模拟片段生成器CELSIM生成片段数据。通过对算法进行测试表明,GTIHR算法能够获得更高重建率的单体型,实际使用价值较强。针对K值未知的情况,对病毒准种单体型重建问题进行了研究。在“已纠错”片段的基础上,提出一种求解该问题的遗传算法GVQHR。针对病毒准种组装问题的特点设计了有效的染色体编码及爬山算子。染色体采用可变长的字符串集合进行编码,爬山算子首先随机去除准种中的某些单体型,然后根据剩余单体型及片段集合重新组建新的准种。算法采用HIV-1型病毒基因进行实验测试。实验结果显示,在各个参数设置下,算法GVQHR能获得较好的重建效果,对进一步科研工作具有一定价值。本文对K单体型组装算法进行研究,并提出了能够较好地重建三倍体个体单体型和病毒准种单体型的方法。这些研究工作为单体型数据在其他生物物种上的研究提供了参考和有效依据。
其他文献
随着科学技术日新月异的发展和软件规模的不断扩大,软件在各个行业得到了广泛的运用,已经成为生活中不可分割的组成部分。虽然软件经过严格的测试,但是每千行代码中平均仍然有10
当今的互联网处于大数据爆炸的知识时代,每天都会产生各种类型、各种结构的海量数据资源等待有效利用和深层挖掘。其中文献数据是科研人员进行相关学术研究,产生新的研究成果
随着社会经济的发展,经济活动水平的不断提高,每年人工爆破的发生频数越来越多。在地震观测台站观测到的波形数据中,如果不作适当处理极易将人工爆炸与天然地震相混淆,地震与爆炸
随着网络的普及,信息时代的到来,人们日常生活所面临的数据已经非常巨大,如何围绕这些数据建立数据仓库、进行数据挖掘和数据分析正逐步成为数据处理的主题。如何快速准确分
随着信息社会的不断发展,军人接触互联网的机会已大大增加,军人在网络上的活动日益频繁。部分现役和退伍军人喜欢在一些网络论坛和社交网站(如QQ,人人网等)中上传自己的军装照片,
自2006年Google提出云计算概念以来,云计算从备受业界质疑的概念炒作成为如今越来越成熟的技术服务形态。在云计算提供的众多服务类型里,存储服务成为我们最为直接使用的一种
图数据是许多计算、科学和工程领域中经常采用的数据结构,图操作则是构建这些领域中许多应用的基石。一直以来,设计高效的图算法就是数学与计算机科学的重要研究内容。随着算
云计算(Cloud computing)已成为了IT界的热门技术,甚至被视为将改变人们生活方式和商业模式的革命性技术。云计算可以被视为网络计算和虚拟化技术的融合:即利用网络分布式计算
为了方便快捷的采集物理环境中的有效信息,无线传感器网络(Wireless Sensor Networks, WSNs)已被人们广泛地应用于生产生活的各个方面,如环境监测、工业和农业控制以及国防军
航班正点率是航空运输服务的重要评价标准,每当进入冬季后,冰雪天气导致航班大量的航班延误,不仅给机场和航空公司带来经济上的损失,而且严重影响机场以及航空公司的声誉,机