论文部分内容阅读
mRNA腺苷酸N~6位置甲基化(m~6A)是在生物体内存在最普遍的一种mRNA修饰,它发生于很多物种中并且发挥着重要的生物学功能。高通量实验方法MeRIP-seq和mi-CLIP在转录组水平上鉴定出了m~6A所在位置图谱,但是由于经费和样本的限制,这样的全转录组范围的m~6A位点图谱鉴定毕竟只在少数物种和组织中实现。特别是mi-CLIP单核苷酸分辨率的m~6A位点鉴定只有两个研究组的报道,而MeRIP-seq的分辨率在100-200nt范围内,无法定位准确的甲基化位置。为了得到更大样本范围较准确的m~6A位点,运用计算生物学的方法对m~6A位点进行从头预测是一个很好的解决办法。另一方面,m~6A在生物学中的作用机制也得到了比较充分的研究,生物实验的研究结果表明,m~6A在mRNA代谢中的可变剪接,转运,翻译和降解中均起着调节作用。有报道称,m~6A在生物钟的维护和细胞周期的调节,干细胞分化和体细胞重编程等过程中均起着重要调控作用。鉴于m~6A对mRNA代谢有着深刻的影响,我们可以推测,很多疾病的发生极有可能和m~6A水平的异常有关,但是目前对于m~6A在疾病例如癌症中所起作用的研究还比较少。在本论文中,首先我们运用生物信息学方法对m~6A位点进行分析和从头预测。我们对m~6A的已有位点进行分析,提取了多个特征,包括位点两边的序列,位点周围的二级结构信息和位点在mRNA上的位置信息等。运用这些信息训练SVM分类器用于预测新的mRNA的m~6A位点。我们分别建立了哺乳动物和植物拟南芥的预测模型,均取得了良好的预测效果。基于预测模型分别构建了方便友好的服务器,其中预测哺乳动物m~6A位点的网站为RNAMethPre,预测拟南芥m~6A位点的网站为AthMethPre。鉴于m~6A在癌症中的作用还没有得到很好的研究,我们首次运用系统生物学方法研究了m~6A在癌症中可能起到的调节作用。整合m~6A位点信息、癌症全基因组外显子测序得到的突变位点数据,鉴定出了可能的癌症相关的m~6A突变位点。这些突变的m~6A位点无法进行正常的甲基化,从而影响所在基因的功能。结果表明,大量的癌症中的m~6A突变位点被鉴定出来,其所在基因很多都与癌症的发生发展有关,揭示了m~6A在癌症中可能起着关键作用。为后续进一步研究m~6A在癌症中的功能提供了坚实的基础。