单体型组装问题枚举算法研究

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:qazwsx07555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分析和识别单体型对复杂疾病致病基因的精确定位有重要作用。单体型组装问题是利用个体DNA测序片段数据推出该个体一对单体型的计算问题。根据不同的优化准则,单体型组装问题有最少SNP(Single Nucleotide Polymorphisms)位点删除模型(Minimum SNP Removal, MSR),最少片段删除模型(Minimum Fragment Removal,MFR)和最少错误更正模型(Minimum Error Correction, MEC)等计算模型,这些模型旨在得到问题的一个最优解,即两条单体型。对生物学家来说,一个解对于复杂的生物问题往往是不够的。基于上述目的,本文为MSR、MFR和MEC设计了能给出多个最优解的模型和相应的参数化枚举算法。MSR模型是试图删除最少SNP位点来确定个体的单体型的计算问题。在此基础上,我们定义MSR的k枚举模型(k-Minimum SNP Removal Enumeration, K_MSR):对于给定的一个SNP矩阵M,一个小正整数k,为MSR模型枚举最多k个解,即得到一个元素个数为k的最优解的集合。我们设计求解K MSR的算法的时间复杂度为O(nk1k2+nkk1+mlogm+mk1),空间复杂度为O(nkk1),其中m为片段数,n为SNP位点数,k1为单个片段覆盖的最大SNP位点数,k2为覆盖任意SNP位点的最大片段数。MFR模型是试图删除最少片段来确定个体单体型的计算问题,在MFR模型的定义的基础上我们提出K_MFR (k-Minimum FragmentRemoval Enumeration)模型:给定一个SNP矩阵M和一个小正整数k,为MFR模型枚举最多k个最优解。我们设计求解该模型算法的时间复杂度为O(mkk22+mkk1k2+mlogm+nk2),空间复杂度为O(mk1+mkk22)。在MEC模型定义的基础上,我们提出MEC的k枚举模型(k-Minimum Error Correction Enumeration,K_MEC),并设计了时间复杂度为O(nk22k2+mlogm+mk1)、空间复杂度为O(mkk12k2+nk2)的算法。大量实验表明上述几种算法可有效提供多个解,可提供较高重建率的单体型,得到的多个解能为为生物学家提供更多选择,对于复杂问题的研究有很大实际意义。
其他文献
Ad Hoc网络是一种由移动节点组成的不依赖基础设施的临时多跳网络,由于它具有易部署、分布式等特点,已被广泛应用在很多领域。随着多媒体等业务的发展,对于在Ad Hoc网络中提
基于静息态功能磁共振(resting-state functional magnetic resonance,rs-fMRI)血氧水平依赖(blood oxygenation level dependent,BOLD)信号的脑功能研究已经成为认知神经科学
近年来,关于下一代互联网和物联网的研究成果日渐丰富,新的数据通信和传输方法不断涌现。其中,新的路由协议是新型网络的关键部分,其正确性直接影响着网络的稳定性。然而路由协议
随着经济、社会以及网络技术的发展,如何保障网络上传输的信息的安全性越来越受到人们的重视,信息隐藏技术的研究已成为信息安全领域的焦点。Word2007是办公处理软件的代表产品
目的:精神性疾病是一类广泛影响患者情绪、社交和认知功能的疾病,给患者及家庭带来沉重的生活负担。对精神类疾病的精确诊断、及早干预意义重大。然而,目前对各类精神疾病的
随着计算机网络规模的不断扩大和通信技术的迅速发展,IPv6协议越来越受到关注。IPv6协议拥有超大的地址空间,解决了IP地址匮乏的问题,而且提高了网络吞吐量,可以更方便更好地支持
虚拟实验室能够低成本、方便快捷地实现实验教学,已成为各高校和研究机构实践教学的有效补充。但由于虚拟实验室用户负载的大幅变化,服务器等硬件资源往往按负载峰值数量配置
随着大数据时代的到来以及云计算等先进数据技术的发展,高维数据处理已经渗透到科研和生活的各个方面,在诸如科学研究、生物医学、网络通信等众多领域起到至关重要的作用。作为
目标识别与目标定位是计算机视觉领域的一个重要分支,随着数字图像在互联网上的爆炸式增长,基于图像局部特征的目标匹配开始在图像检索中占据越来越重要的地位,图像的整体分类已