论文部分内容阅读
研究背景:tsRNA(t RNA-derived small RNA,tsRNA)是近年来发现、存在于多种生物体内的一类新型小非编码RNA(small non-coding RNA,snc RNA),具有调控蛋白质翻译、反转录转座子、肿瘤发生和表观遗传等多种功能。ts RNA来源于成熟t RNA或t RNA前体,序列上具有丰富的RNA修饰,从而增加了其结构和功能的多样性,但同时也极大地干扰了小RNA测序(RNA sequencing,RNA-seq)文库的制备。传统的snc RNA测序时,需将adapter连接(adapter ligation,AL)到RNA的3’和5’端,随后进行反转录(reverse transcription,RT)和聚合酶链反应(polymerase chain reaction,PCR),从而获得c DNA文库进行二代测序。然而,该方法对ts RNA和rs RNA(r RNA-derived small RNA,rs RNA)等具有多种RNA修饰的snc RNA会产生偏倚的测序结果,部分原因是特定的RNA修饰如3’-磷酸(3’-P)和2’3’-环磷酸(2’3’-CP)等末端修饰可以阻断AL,m1A、m3C、m1G和m22G等甲基化修饰可以干扰RT,导致这类RNA不能或者不完全能逆转成c DNA,从而无法被小RNA的高通量测序检测发现。尽管目前测序技术中已有利用AlkB(Dealkylating enzyme alpha-ketoglutarate-dependent hydroxylase,AlkB)去除RNA甲基化修饰和T4PNK(T4 polynucleotide kinase,T4PNK)处理RNA末端修饰的实验方案,但是,每一种酶都只能去除某类RNA修饰,因此无法完整地揭示样品的snc RNA谱。更为重要的是,在特定类型的组织/细胞中,带有阻断RT和/或AL的RNA修饰的snc RNA的相对组成是未知的,这也极大地限制了相关酶的使用。此外,以往对snc RNA的生物信息学分析主要集中在mi RNA上,忽视了RNA-seq数据中可能有重要作用的其它snc RNA信息。因此,建立一种全面的小RNA测序及分析方法,对具有特定修饰的snc RNA尤其是ts RNA和rs RNA的功能研究具有重要价值。研究目的:建立一种基于去除阻碍cDNA文库构建的多种RNA修饰的小RNA测序方法—PANDORA-seq(Panoramic RNA Display by Overcoming RNA Modification Aborted Sequencing,PANDORA-seq),全面呈现样品中不同种类的snc RNA表达全景图,结合先进的小RNA比对及生物信息分析流程,揭示传统方法无法检测的带特定RNA修饰的snc RNA,尤其是ts RNA和rs RNA的相对表达信息,为其功能和作为疾病标志物的研究奠定基础。研究方法:1.通过液相色谱串联质谱的高通量RNA修饰定量平台和AL实验,检测AlkB和T4PNK处理前后,小RNA序列上RNA甲基化修饰的变化和小RNA与adapter连接效率的改变,验证AlkB和T4PNK去除RNA甲基化修饰和末端磷酸化修饰的有效性;2.应用Northern blot检测AlkB和T4PNK处理前后,样品总RNA和15-50nt RNA片段中ts RNA和rs RNA的变化,探索AlkB和T4PNK是否会引起样品RNA的降解;3.AlkB和T4PNK按不同的先后顺序处理样品,通过测序结果的相关性分析,明确两种酶的处理顺序对测序结果的影响;4.对小鼠和人的不同组织/细胞样品进行传统、AlkB处理、T4PNK处理和PANDORA-seq(AlkB+T4PNK)处理,并利用课题组研发的小RNA专用注释工具和分析流程对测序数据进行分析,再使用Northern blot对测序结果加以验证,最终证实PANDORA-seq对高度修饰的snc RNA的检测能力;5.利用PANDORA-seq方法分析健康成人血清和外周血单个核细胞(Peripheral Blood Mononuclear Cell,PBMC)的snc RNA,尤其是ts RNA和rs RNA的表达谱。研究结果:1.AlkB处理前后,小鼠肝脏组织15-50nt RNA片段上m1A/A,m1G/G,m3C/C和m22G/G的百分比分别是12.627±0.146 vs.0.000±0.000(P<0.0001),8.466±0.256 vs.2.134±0.131(P=0.0001),2.281±0.316 vs.0.000±0.000(P=0.0039)和3.592±0.230 vs.1.277±0.057(P=0.0017),提示AlkB有效地去除了15-50nt RNA片段上m1A、m1G、m3C和m22G的甲基化修饰;T4PNK处理促进了人工合成和小鼠组织来源的含3’-P/2’3’-CP末端的小RNA与adapter的连接。表明T4PNK和AlkB的联合应用能极大提高小RNA 3’端与adapter的整体连接效率和改善RNA的反转录过程;2.AlkB可引起样品总RNA的降解,造成测序文库中小RNA增多的假象,然而通过切胶、预先分离出15-50nt RNA片段,再进行AlkB处理,则可有效地避免假阳性结果的出现。因此,酶处理前,设置样品RNA片段大小预选程序能确保测序结果的准确性和可靠性;3.AlkB和T4PNK不同处理顺序的测序结果的相关系数达到0.995,表明两种酶的先后处理顺序对小RNA测序结果无影响;4.在小鼠脑、肝、脾、成熟精子和人He La细胞中,传统测序检测出的snc RNA的主要类别是mi RNA(成熟精子除外)。与传统测序、T4PNK和AlkB单独处理的RNA-seq比较,PANDORA-seq发现了数千种以前未被检测到的修饰snc RNA,其中大部分是ts RNA和rs RNA,且测序结果准确地反映出不同组织/细胞中各类snc RNA的相对表达水平。此外,ts RNA和rs RNA的表达具有组织和细胞类型的特异性;5.PANDORA-seq揭示了人血清和PBMC的snc RNA表达谱。血清中ts RNA及其修饰的水平远远高于目前的认识,PBMC中ts RNA对T4PNK和/或AlkB的反应与血清ts RNA不同。血清和PBMC中还富含rs RNA和ys RNA。研究结论:本研究建立的PANDORA-seq优于传统测序和AlkB-或T4PNK-单独处理的RNA-seq,结合课题组研发的小RNA专用注释工具和分析策略,不仅能够直观呈现小鼠和人类不同组织/细胞的snc RNA表达谱,还能全面准确地发现各个组织/细胞中以前未被检测出的带特定修饰的snc RNA,尤其ts RNA和rs RNA,这为将来深入开展这些小RNA的细胞及分子功能研究和作为疾病生物标志物的研究奠定了基础。