基于序列分析的microRNA计算研究

来源 :复旦大学 | 被引量 : 5次 | 上传用户:coldbee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非编码小RNA是对一类长度为20-30个碱基且不翻译成蛋白质的RNA小分子的统称。目前已知的非编码小RNA主要有三类,分别是siRNA, miRNA和piRNA。这些非编码小RNA分子既能够参与转录阶段的调控,又能够实现转录后的调控,在生物体生长发育过程中发挥着非常重要的作用。近年来,非编码小RNA的研究得到了广泛的关注。基于序列,本文使用机器学习的方法对一种代表性的非编码小RNA分子miRNA产生机制以及作用原理展开了广泛且深入的研究,取得了一系列的研究成果。概括起来,主要包含以下四个方而:1.提出了一种新的miRNA前体预测方法miRenSVM。通过提取并选择合适的特征,该方法能够识别二级结构包含多茎-环的miRNA前体。进一步运用组合分类方法,我们有效的解决了miRNA前体预测中一直存在的样本不均衡问题。通过与其他方法比较,miRenSVM的表现明显优于现有的预测方法。随后,用27个物种的5238个miRNA前体序列做测试,其准确率达到了92.84%。2.为了有效的组织和管理现有的miRNA数据,提出了一种基于有监督学习的方法miRFam用于自动划分miRNA前体的家族。该方法仅依靠miRNA的序列信息,通过提取n-gram特征,并使用multi-class SVM对由n-gram组成的特征向量进行分类。相比于传统的序列比对方法,miRFam的效率和准确率明显更高。实验测试表明,miRFam方法完全可以满足实际应用当中快速、准确的要求,因此可以大大节省人力和物力成本。3.通过整合现有的植物miRNA靶基因预测方法,首次提出了一种预测拟南芥miRNA靶基因的整合方法imiRTP。伴随着研究的深入,miRNA与其靶基因的作用原理也变得更加复杂。现有的方法并不足以很好的解决这一问题,因此有必要研究新的靶基因预测方法。参考动物miRNA靶基因预测的成功经验,我们挑选了四种当下最流行的植物miRNA靶基因预测方法整合在imiRTP中,并提出了四条标准用于进一步筛选高质量的拟南芥miRNA靶基因。4.基于NGS数据,提出了一种新的TAS基因预测方法,并提出了次级双引物模型用于解释拟南芥TAS2基因与某些PPR基因之间的作用关系。基于拟南芥根部Illumina测序的多个数据集,结合模式识别的方法,我们成功实现了拟南芥TAS基因的预测,得到的结果比基于统计的方法更为精确可靠。在大量计算的基础上,我们还研究了初级和次级ta-siRNA的产生原理,并提出了次级双引物模型对拟南芥miRNA-TAS2-PPR之间的作用关系进行了详细的描述。
其他文献
目的:通过回顾性分析122例鼻咽癌初治患者的资料,分别按1992年福州分期(以下简称’92分期)、2008分期、第六版UICC/AJCC分期(以下简称2002分期)、第七版UICC/AJCC分期(以下简
电流互感器是电网安全稳定运行的重要组成部分。本文从电流互感器在电力系统中的作用及其特性入手,简要介绍了其二次不能开路运行的特性。针对现场运行环境,分析了其二次回路
背景及目的:眶内肿瘤及肿瘤样病变是眼科常见疾病,是导致患者失明的常见原因,所以早期准确的诊断十分重要。眼眶解剖结构精细,病变种类繁多,不易活检诊断。随着各种影像学检
“中国制造”的品质革命,不仅要靠工艺上的创新,也要靠精益求精的工匠精神。文章以亚洲与欧洲的陶瓷生产为着力点,运用文献资料法、历史研究法、比较分析法的形式,研究工匠精
明代戏剧《红梅记》李慧娘的鬼魂形象,鲜明、生动、感人,蕴涵着深刻的文化意蕴,她对爱情的大胆追求,彰显出对人性自由的呼唤;救人于危困,反映出人们对情义、侠义精神的认同和
通过分析大生产试验中Si、Al等主要合金元素与成品性能的关系,设计出合理的化学成分;依据大生产热轧板坯加热温度、精轧和终轧温度等主要工艺因素对成品磁性能的影响规律,进
在这个全球化的时代,随着交易成本的降低和世界性专业化分工,国际贸易特征变化明显。比较优势理论解释的传统货物贸易将被任务贸易所替代。东亚已经成为全球生产和贸易的中心
<正>死亡,对于人来说,不单是有机体的生命终止问题,而且涉及到灵与肉、个体与族类、死灭与不朽、必然与自由等一系列重大哲学问题,成为一个人们不能不猜的斯芬克斯之谜.自有
<正>《化学教学》2015年第5期刊登了"对一道高考试题的商榷"一文[1],文章对2013年山东省高考化学试题第13题进行了分析,认为此题还欠严谨,但笔者认为,文中的分析还有可商榷之
介绍了电动钻机使用网电的意义,指出钻机电控系统存在谐波和无功的来源,提出基于SVG技术的治理方案,简述SVG的工作原理,给出了设计要点和配置要点。现场应用的测试结果表明,S