基于基因突变频率的癌症驱动基因筛选

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:kdmasong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
体细胞发生基因突变诱发癌症,肿瘤细胞中的基因突变包含两种:驱动突变和乘客突变,而癌症驱动基因发生突变是癌症产生的最主要原因。因此,癌症驱动基因的筛选对癌症病理研究、癌症临床治疗和新型抗癌药物开发都具有十分重要的意义。本文依托高通量测序技术得到基因突变数据,基于基因突变频率筛选癌症驱动基因。  本研究首先采用基于基因突变频率通过使用基因协变量数据克服基因突变异质性问题的MutSigCV算法作为驱动基因基础筛选方法。为解决原算法平台Matlab在算法运行中数据读取速度慢及与其他数据处理流程相结合不流畅等问题,本文使用R语言完成了对MutSigCV算法的实现。同时,很好的完成了算法与R中其他生物信息包的兼容。其次,对MutSigCV算法在筛选邻近基因时阈值需人为凭经验选取等缺点,采用Ward聚类法和轮廓系数法相结合的方法利用基因协变量数据实现基因的聚类,进而对每个基因筛选邻近基因。最后使用二维投影赋值技术参考突变类型及突变影响对每种突变赋值,使用假设检验完成癌症驱动基因筛选。对本方法与原MutSigCV算法在肺癌基因突变数据上进行验证实验,实验结果表明本方法具有更好的筛选效果。最后将改进MutSigCV算法应用于某癌症驱动基因筛选,实验结果表明本算法能有效地对癌症驱动基因进行筛选。
其他文献
双目(立体)视觉是计算机视觉研究领域中的重要分支之一,是一种最重要的距离感知技术。它通过模拟人类仿生视觉系统的方式,用于对空间点进行立体定位。从立体视觉技术诞生至今,经过
乳化炸药作为一种新型的民用爆破材料,在矿产开发、水利建设、城市建设及其他民用领域都发挥着越来越重要的作用,但是随着社会的不断进步,人们对工业生产安全的重视程度也在不断
稳定系统受冲击作用的影响,其结构和变动方向将会发生变化。本文拟解决复杂大系统受外界冲击作用,带来的系统稳定性变动等变化,以系统的构成元素为研究对象,通过将系统的各组成对
本文主要是研究有监督学习算法的一种-支持向量机(SVM)算法,在深入研究支持向量机理论的基础上,提出了具有遗忘因子的递推最小二乘支持向量机(FFRLSSVM)算法。并针对间歇过程在
液压机是一种以高压液体传送工作压力的压制设备,随着航空航天汽车造船等行业的飞速发展,对大型化高精度智能化和宜人化的液压机的需求越来越大随着压制吨位的增加,必须提高液压机的出力,一般设计多缸液压机,而多缸液压机一般是一个滑块同时与多个液压缸相连接,这种机械结构会使系统产生强耦合过驱动和液压缸同步问题液压系统中的伺服阀实现了传递介质的流量和压力之间的转换,由于流量与压力的开平方关系,导致了液压系统的非
无线网络控制系统,相对于传统的控制系统,引入了无线网络,带来了一些很多新的问题需要研究,如丢包、时滞等,同时由于网络带宽的限制使得数据在传输之前往往要先量化,进而带来量化误
在实际控制系统中,往往伴随着时滞现象。而时滞常常被认为是导致系统性能下降甚至是系统不稳定的原因,因此对时滞系统进行研究具有重要的理论意义和实际意义。自Rosenbrock于20
随着国内汽车工业的快速发展,变截面板簧的需求量逐年递增,对产品质量的要求也越来越高,而改进其成形设备,选择合适的智能控制方案是提高产品质量的有效途径。本文首先介绍了
作为产品质量监管的重要手段,喷印标识技术逐渐受到社会的关注。然而作为标识环节的执行主体,国内喷码机设备的性能指标却一直低于国际水平,导致市场占有率偏低。嵌入式技术的发
油冷却器作为热量传递的设备已被广泛地应用到石油、电力、化工、冶金等行业,它是工业生产中的重要组成部分,因此对油冷却器进行更为深入的实验与理论研究,通过优化设计来提高油