论文部分内容阅读
目的密码子偏爱性分析已成为多种学科研究的热点问题与前沿方向。在医学病毒学的研究领域里,密码子偏爱性分析常用来了解不同病毒株间进化关系,明确它们之间的遗传特性,进而为疾病的防控与疫苗的研制方面提供重要的理论基础。本课题分析六种人冠状病毒(HCoV:SARS-CoV、MERS-CoV、HCoV-229E、HCoV-NL63、HCoV-OC43、HCoV-HKU1)的密码子偏爱性,了解它们之间的进化关系;又分析不同宿主间高致病性冠状病毒(SARS-CoV、MERS-CoV)的密码子偏爱性及它们的进化关系,以明确高致病性冠状病毒的遗传特性,为其防控提供重要的理论依据。同时利用分子克隆技术构建高致病性冠状病毒不同长度的S蛋白(SARS-S、SARS-S1、SARS-RBD、MERS-S1、MERS-RBD)的真核表达重组质粒,为进一步S蛋白表达及功能研究奠定一定的理论基础。方法本研究,从NCBI下载了所需的冠状病毒基因编码序列(CDS),使用Lasergene子程序EditSeq保存截取的蛋白编码序列;使用EMBOSS子程序CUSP计算密码子Frequency值;CodonW计算密码子ENC、GC、GC3S、RSCU值。使用ENC、RSCU指标,衡量密码子偏好性;用ENC-Plot、中性绘图分析、PR2分析、聚类分析的方法,分析密码子偏爱性的影响因素,以及它们之间的进化关系。同时,我们利用分子克隆技术构建高致病性冠状病毒不同长度的S蛋白(SARS-S、SARS-S1、SARS-RBD、MERS-S1、MERS-RBD)的真核表达重组质粒。结果1.六种HCoV密码子偏爱性分析结果显示:各蛋白ENC平均值均接近61;通过RSCU平均值的分析,找出了六种HCoV各蛋白间的偏爱性密码子(RSCU>1)与非偏爱性密码子(RSCU<1),其中各HCoV偏爱性密码子均以A、U结尾的密码子为主;ENC-Plot结果显示,六种HCoV各蛋白几乎落在了相似区域,且远离标准曲线;中性绘图分析结果显示,六种HCoV所有蛋白斜率(b)除HCoV-NL63斜率较大(0.7267),其他斜率均较小;奇偶规则分析结果显示,大部分基因落在了左下方。另外,基于结构蛋白S与非结构蛋白ORF1ab的密码子偏爱性聚类结果显示,在S蛋白上,HCoV-OC43、HCoV-NL63、HCoV-229E聚为一起;而HCoV-HKU1、SARS-CoV、MERS-CoV聚在了一起;ORF1ab结果显示,SARS-CoV、HCoV-NL63、HCoV-229E、HCoV-OC43、HCoV-HKU1聚在了一起,MERS-CoV单独聚为一类。2.SARS-CoV与SARSr-CoV密码子偏爱性比较及聚类分析结果显示:两者各蛋白有效密码子数目(ENC)平均值均接近61;SARS-CoV编码的各蛋白偏爱的密码子(RSCU>1)个数在20-27之间,SARSr-CoV编码的各蛋白偏爱的密码子(RSCU>1)个数在17-30之间,并且两者皆以A、U结尾的密码子为主;其中,AUU、ACU为SARS-CoV的12种蛋白共有的偏爱密码子,而GGG、UGG、CUG、AUC、AUG为非偏性密码子。另,CUU为SARSr-CoV的12种蛋白共有的偏爱密码子,而GGG、UGG、AGC、CGG为非偏性密码子;ENC-Plot结果显示,两者几乎落在了相似区域,且远离标准曲线;中性绘图分析结果显示,SARS-CoV与SARSr-CoV的S、ORF1a两蛋白的斜率均较小;奇偶规则分析结果显示,大部分基因落在了左下方。基于密码子偏爱性的聚类分析结果显示,在S蛋白上,SARSr-CoV/RSYN2013/Yunnan、SARSr-CoV/RS/WIVI1/Yunnan/2013、SARSr-CoV/Rs/WIV16/Yunnan/2013三株与SARS-CoV进化关系最为密切。而RS7327、RS9401、RS4084、RS4231、RS4874这5株新报道的SARSr-CoV同样可与SARS-CoV聚为一类;而新近发现的RS4081、RS4255、AS6526、RS4237、RS4247、Rf4092这6株SARSr-CoV则与华南地区(香港、广西)发现的SARSr-CoV聚为一类;云南株YNLF31C、YNLF34C、RS3367与中国西南(贵州、广西)、华中(湖北)、华北(河北)、东北(吉林)发现的病毒株聚在了一起,同时,地域相邻的山西、陕西则单独聚为一类。而非结构蛋白ORF1a的聚类分析发现,云南蝙蝠中发现的SARSr-CoV均与可以感染人和果子狸的SARS-CoV聚在了一起,同时,该分支同时包括了来自于贵州、广西、湖北的毒株。而香港报道的SARSr-CoV毒株与SARS-CoV差异较大,与一株来自湖北的毒株共同聚为一类。中国中北部地区的山西、陕西、河北、湖北、吉林的SARSr-CoV则共同聚为一类。3.MERS-CoV密码子偏爱性分析及聚类分析结果显示:Human-MERS-CoV和Camel-MERS-CoV的ENC平均值均接近61;Human-MERS-CoV编码的各蛋白偏爱的密码子(RSCU>1)个数在29-31之间,Camel-MERS-CoV编码的各蛋白偏爱的密码子(RSCU>1)个数在29-32之间,并且两者皆以A、U结尾的密码子为主;其中,UUU、UUG、CUU、AUU、UCU、CCU、CAU、AAU、GAA、CGU、AGU、AGG、GGU为Human-MERS的11种蛋白共有的偏爱密码子,而UUC、CUC、CUA、AUC、GUC、GUA、UCC、CCC、ACC、ACG、GCC、UAC、CAC、GAC、UGC、CGC、CGA、AGC为Human-MERS的11种蛋白共有的非偏性密码子。另,UUU、UUA、UUG、AUU、GUG、UCU、UCA、CCU、CCA、ACU、ACA、GCU、GCA、UAU、CAA、GAA、UGU、AGU、AGA、AGG、GGU为Camel-MERS-CoV的11种蛋白共有的偏爱密码子,而UUC、CUC、CUA、AUC、AUG、GUC、UCG、CCC、CCG、ACC、ACG、GCC、GCG、UAC、UAG、UCC、CAC、CAG、GAG、UGC、UGG、CGC、CGA、CGG、AGC、GGG为Camel-MERS-CoV的11种蛋白共有的非偏性密码子;ENC-Plot结果显示,两者几乎落在了相似区域,且远离标准曲线;中性绘图分析结果显示,Human-MERS-CoV与Camel-MERS-CoV各蛋白中均较小。奇偶规则分析结果显示,大部分基因落在了左下方。聚类分析结果显示,2012-2018年,Camel-MERS-CoV偏爱性与Human-MERS-CoV相似,几乎在每条蛋白上都可看到两者聚在一起的流行株。而MERS-CoV ORF8b蛋白的密码子偏爱性相对稳定并单独聚为一类,即Human-MERS-CoV与Camel-MERS-CoV单独聚类。但从流行时间的内部去剖析,发现2017年的Camel-MERS-CoV流行株,在许多内部蛋白中(E、ORF1a、ORF1ab、ORF4a、ORF5、ORF8b),都聚在了距离其他年份(2012-2016)较远的位置;其中,在E和ORF1ab两种蛋白中,其与2011年Bat-MERS-CoV很好地聚在了一起;同时2017年Camel-MERS-CoV在S、M、ORF4b蛋白上,又和Human-MERS-CoV聚为了一类。而在Human-MERS-CoV中,除了ORF1ab与ORF8b两种蛋白之外,2018年的Human-MERS-CoV与Camel-MERS-CoV(2012-2016)均具有极其相近的聚类关系;同时更有趣的是,在MERS-CoV的ORF4b蛋白中,2015-2017年,各年份下Human-MERS-CoV和Camel-MERS-CoV均聚为一起。4.本研究利用分子克隆技术成功构建出高致病性冠状病毒S蛋白(SARS-S、SARS-S1、SARS-RBD、MERS-S、MERS-S1、MERS-RBD)的真核表达重组质粒。结论1.六种HCoV的密码子偏爱性均较弱,偏爱性密码子均以A、U结尾为主;六者在进化过程中受自身突变与自然选择双重因素影响,且以自然选择为主;由4个密码子编码的氨基酸的第3位碱基中,C和T(嘧啶)的使用频率高于G和A(嘌呤),其中,高致病性冠状病毒(SARSr-CoV、MERS-CoV)嘧啶、嘌呤均使用,而普通HCoV(HCoV-229E、HCoV-NL63、HCoV-HKU1、HCoV-OC43)几乎不使用G和A(嘌呤);密码子偏爱性的聚类分析结果显示,六者的聚类关系与基于它们的基因组的进化树结果不同。2.SARS-CoV与SARSr-CoV密码子偏性较弱,且偏爱的密码子均以A、U结尾为主。两者在进化过程中同时受自身突变和自然选择双重因素影响,其中,以自然选择为主;由4个密码子编码的氨基酸的第3位碱基中,C和T(嘧啶)的使用频率高于G和A(嘌呤),且其频率存在显著偏倚;SARSr-CoV的密码子偏爱性与它们的地理位置有关,相近地区的SARSr-CoV能较好的聚类;云南蝙蝠SARSr-CoV可能是SARS-CoV、及其他地区SARSr-CoV重要的天然基因库;云南SARSr-CoV跨物种感染人的可能性需要引起我们的重视。3.Human-MERS-CoV与Camel-MERS-CoV的密码子偏爱性均较弱,两者偏爱的密码子以A、U结尾为主;两者在进化过程中同时受自身突变和自然选择双重因素影响,其中,以自然选择为主。PR2分析结果显示,密码子的第三位C和T(嘧啶)的使用频率高于G和A(嘌呤),且其频率存在显著偏倚。同时,基于密码子偏性的聚类分析发现,Human-MERS-CoV偏爱性与Camel-MERS-CoV相似,两者进化关系比较相近。2017年,Camel-MERS-CoV可能发生了变异。近三年ORF4b蛋白,Human-MERS-CoV与Camel-MERS-CoV具有极其相近的聚类关系;而ORF8b两者又单独聚类,呈现出密码子偏性比较稳定的聚类特征。因此,ORF4b与ORF8b可能是我们防控MERS的关键蛋白。4.本研究利用分子克隆技术成功构建出高致病性冠状病毒不同长度的S蛋白(SARS-S、SARS-S1、SARS-RBD、MERS-S、MERS-S1、MERS-RBD)的真核表达重组质粒,为进一步S蛋白表达及功能研究奠定一定的理论基础,能够为进一步S蛋白表达及功能研究奠定一定的理论基础。