基于基因组测序数据的拷贝数变异检测方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:jcx88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基因组测序技术的迅猛发展,个人基因组测序已逐渐成为疾病诊疗、健康管理以及探寻生命奥秘的主要手段之一,极大推动了遗传学、基因组学和医学等相关学科的发展。与此同时,越来越多的科学实验表明,拷贝数变异作为基因组变异中一种重要的结构性变异,与生命进化、生物多样性以及多种复杂疾病、罕见病的发生和发展紧密关联。因此,全面、准确检测拷贝数变异对于探索生命体自然规律、揭示生命奥秘以及理解疾病产生机制、寻找致病靶点和疾病诊疗都具有十分重要的研究意义。然而,由于人类基因组自身的高度复杂性、测序数据的超大数据量以及现有测序技术自身的局限等因素,如何快速、有效地检测和分析拷贝数变异面临着巨大的挑战。本文围绕基于基因组测序技术的拷贝数变异检测方法为研究重点开展相关研究。本研究的目标是通过对现有外显子组测序数据拷贝数变异检测方法的系统评价,提出具有更高敏感性和特异性的外显子组拷贝数变异检测方法;同时,提出一种基于广义拓扑熵的基因组序列分析方法,对拷贝数复制序列进行检测与分析。本文的主要研究内容、研究方法如下:第一,针对目前外显子组测序数据拷贝数变异检测方法在真实数据中检测效果不明确以及没有系统的测评标准等问题,本文首先提出客观评价外显子组测序数据拷贝数变异检测效果的测评方法,并对业内主流的外显子组拷贝数变异检测方法进行系统测评。测评标准及测评结果可以为相关科研人员针对其各自的科学实验选择不同的检测方法提供理论依据,同时为进一步提出新的拷贝数变异检测方法奠定基础。第二,针对现有基于外显子组测序数据拷贝数变异检测方法检测效果不理想的问题,提出新的基于群体样本模式的拷贝数变异检测方法。该方法首先使用主成分分析等手段对外显子组测序数据进行降噪;随后,该方法全面整合reads深度和单核苷酸变异(Single Nucleotide Variation,SNV)信息,共同组成双链隐马尔科夫模型进行拷贝数变异检测。第三,为进一步提升外显子组测序数据拷贝数变异检测效果,提出基于融合样本模式的外显子组拷贝数变异检测方法。避免基于群体样本模式降噪过度等问题,该方法提出基于单样本模式的外显子组拷贝数变异检测方法。首先,该方法利用三步中位数校正方法对已知噪声源的噪声信号予以去除;其次,利用负二项分布模型对降噪后的reads深度信号进行拟合,同时利用reads深度及SNV信息组成双链隐马尔科夫模型进行拷贝数变异检测;最后,将基于单样本模式的拷贝数变异检测结果与基于群体样本模式的拷贝数变异检测结果进行融合,形成最终的拷贝数变异检测结果。第四,提出基于广义拓扑熵的拷贝数片段复制序列检测方法。从数学上证明广义拓扑熵与拓扑熵之间的关系,并将其应用于人类参考基因组中的不同基因组元件、拷贝数片段复制及个体基因组短串联重复序列的检测研究当中,从一个新的维度去审视和理解拷贝数复制序列,为后续拷贝数复制的精准检测提供新的思路和解决方法。综上,本文客观全面地提出了基于外显子组测序数据的拷贝数变异检测效果测评方法;提出了新的基于群体样本模式和融合样本模式的外显子组拷贝数变异检测方法,全面整合reads深度和SNV信息组成双链隐马尔科夫模型对拷贝数变异进行检测,有效提高了检测效果,具有较高的实际意义;提出了基于广义拓扑熵的拷贝数片段复制序列检测方法,具有一定的理论和实际意义。
其他文献
为克服传统的车间布局规划方法的不足,提出一种新的基于数字化工厂理论的布局规划方法。重点介绍该布局规划方法的流程和关键技术。该布局规划方法采用可视化仿真建模技术,开
<正>北京中科虹霸科技有限公司(简称中科虹霸)是中科院自动化研究所设立的高新技术企业,专业从事生物特征认识别、信息安全等领域的技术研究、产品开发与成果转化,已获得联想
随着科技的高速发展,人们对生活质量的要求越来越高,无人驾驶汽车已经被广为研发和试用,由此智能小车的快速发展也是在情理之中。通过对基于单片机的智能小车的硬件及软件设
<正>伦敦佛里斯特中学是一所有远见的、并且愿意接受新科技的学校。近年来,在系统管理员David Posner的建议和指导下,该学校在IT人员和设备等方面都进行了很大的投资,他们认
<正>一、教学背景"思维导图"(mind map)是英国著名心理学家东尼·博赞(Tony Buzan)20世纪60年代发明的风靡世界的可视化组织性思维工具。这种技术将词汇、图形、数字、逻辑、
由于世界镍需求增长和硫化镍资源短缺 ,红土型镍矿资源开发将成为未来十年镍业发展的主要趋势。 1999年以来 ,澳大利亚西部新建的总投资 2 0多亿澳元的三个高压酸浸技术HPAL
如果不能充分了解这个世界,人类也就不可能有效地参与这个世界。现时代,科学向传统哲学智慧提出了挑战。科学和人文之间,自然界和人类世界之间在传统中存在着鸿沟。生态危机
在介绍水下石油管道法兰连接机具的工作原理的基础上,设计了螺母库的多马达同步控制系统。采用同步阀与同步分流器组合方式实现了20个马达的速度同步。分析了影响液压系统同
<正>新传播背景下电视新闻在传播模式上发生了很大变化,呈现出直播化、国际化、品牌化与分众化的特点。一、新传播背景对电视新闻节目主持人的冲击新传播指的是与传统传播形
以贮气瓶供气弹射系统作为研究对象,利用功率键合图和"分段建模"的方法建立了数学模型,用MATLAB软件编制了仿真模型,并用验证过的仿真模型对该系统进行大量仿真研究,得到了系