CNV区域周围的基因预测研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:a11253919
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
拷贝数变异(CNVs,CopyNumberVariations)是指基因组中与参考序列相比>1kb的DNA片段插入、缺失和/或扩增,具有分布广泛、可遗传、富含重复序列等特征。CNV通过直接或间接方式改变基因表达,与多种疾病密切相关。目前的CNV研究多是针对区域中已知的基因展开。然而现有的基因组注释还不完善,这可能导致含有潜在新基因的CNV被遗漏,因此有必要对CNV区域进行基因预测以加深研究。已有的基因预测方法主要分为基于序列比对的方法、从头预测的方法和混合方法三类,每一类中都包含各种软件。但这些软件在基因预测过程中都首先忽略重复序列,而CNV区域中恰恰富含重复序列,因此已有方法并不适合对CNV区域进行基因预测。本文探索性地在基因预测时保留重复序列,并有针对性地选择与重复序列高度相关的CNV区域作为研究对象。文中主要包含以下两部分工作:(1)构建了基于隐马尔可夫模型的混合方法预测系统。综合考虑DNA结构特征、保守序列特征和EST表达序列信息,从信号和区域两部分进行基因识别。(2)选择230个已报道的CNV区域作为测试数据集进行基因预测。结果显示系统在基因水平上的预测灵敏度达到18%。此外,部分预测结果与参考基因相比多出一个或几个外显子,而这些外显子或临近内含子中的重复序列含量都较高。
其他文献
为明确马铃薯StPR1基因在抗病中的作用,构建了植物表达载体pBI121-StPR1,并通过农杆菌转化法将StPR1基因导入烟草中,采用不同的致病菌对转基因烟草进行处理,对其抗病性及生理
旨在通过克隆牦牛MDHⅡ基因,探究其组织表达谱及与脂代谢候选基因的相关性,为进一步研究牦牛脂代谢机制提供基础数据.采集0.5,2.5,3.5,7.5岁4个年龄段的12头牦牛心脏、肝脏、
情感计算是让计算机具有人类的情感,并且使它具有识别情感状态的能力。情感识别是情感计算的重要领域,在基于生理信号的情感识别中,心电信号是主要的研究对象。心电信号的变化状
山药微块茎是获得山药脱毒良种种芋的主要途径.介绍了山药微块茎的国内外研究进展,包括山药的地方品种、微块茎研究的意义、影响微块茎生产效率的因素、微块茎移栽注意事项、
随着社会竞争的加剧及压力的增大,心理健康和精神方面的疾病逐渐成为研究的热点。眼动仪是开展相关研究的重要仪器,主要用于记录人在观看外界场景时的眼球活动轨迹和瞳孔大小变化,并广泛应用于注意、视知觉、阅读、精神分裂等领域的研究。目前眼动仪的价格都比较贵且大部分为进口产品,鉴于此,本课题拟研制一款成本低廉的眼动仪,以满足基层医疗单位的使用需求。本论文研究设计并研制了一款托架式眼动仪,主要包括眼动仪硬件的搭
研究目的:生物医学信号大部分属于时变非平稳信号,时频分析方法是分析此类信号的有力工具。本文针对短时傅里叶变换时频分辨率低以及Wigner-Ville分布存在交叉项干扰的问题,深
随着经济的快速发展,人类饮食结构的不断改变,心血管疾病的发病率和死亡率均在迅速上升,严重威胁着人类的健康和幸福生活。心音是由心脏机械运动产生的振动信号,蕴含着与心血
目的:  当今社会,人们对于微生物的存在已经非常熟悉,而由致病性微生物所导致的疾病也获得了人们的广泛关注。致病微生物通过饮用水、食品、水产品等对人身体产生危害,导致发烧