论文部分内容阅读
鼻咽癌(nasopharyngealcarcinoma,NPC)是一种来源于鼻咽部上皮细胞的恶性肿瘤,死亡率在癌症中排第8位。好发于中国和东南亚地区,80%的NPC发生在我国,发病率居世界之首。NPC的发病具有地方性和种族特异性,目前研究表明NPC的发生与饮食习惯、环境因素、遗传易感性和EB病毒(Epstein-Barrvirus,EBV)感染相关。研究表明,大部分低分化鳞癌和几乎所有未分化鳞癌均可发现EBV感染。
EBV属疱疹病毒科γ亚型,主要含线性双链DNA,约172,000碱基,由末端重复序列、单一序列和内部重复序列组成。约有84个ORFs,编码80余种蛋白,大多数基因产物与病毒复制相关。EBV生活周期分为潜伏期、立早期、早期和晚期,不同阶段表达不同的蛋白质,发挥不同的作用。BKRF1基因编码的EBV核抗原(EBV’snucleicantigene,EBVNA)1是维持潜伏状态的必须蛋白;BNLF1编码的潜伏膜蛋白1(latentmembraneprotein1,LMP1)是唯一具有瘤功能的蛋白;由BZLF1基因编码的Z蛋白(Zebra)是病毒进入裂解状态的重要蛋白。
LMP1主要通过NF-κB、AP-1以及JAK/STAT等信号途径发挥作用,抑制B淋巴细胞程序性死亡、增强癌基因bcl-2的表达、并不断刺激细胞生长信号的传递,使细胞的生长失去控制,无限增殖并向恶性转化。Z蛋白在EBV从潜伏周期进入繁殖(裂解)周期的过程中起关键作用,为病毒的复制、晚期结构蛋白的表达打下基础。裂解复制可阻遏细胞从G1期进入S期,是肿瘤发生的重要环节。
随着人类基因组测序计划的完成,大量微阵列表达数据的积累,以及应运而生的生物信息学的发展给肿瘤分子发病机理的研究开阔了新的研究思路、开辟了新的道路。生物信息学是一门由计算机技术、统计学、数学、遗传学、分子生物学、医学、信息学、生物物理和化学等结合的交叉学科。一般意义上,生物信息学是研究生物信息的采集、处理、存储、传播、分析和解释等各方面的一门学科,它通过综合利用生物学、计算机科学和信息技术来揭示大量而复杂的生物数据所赋有的生物学奥秘。它的研究重点主要体现在基因组学(Genomics)和蛋白组学(Proteomics)两方面。通过对DNA序列的统计计算分析,更加深入地理解DNA序列、结构、演化及其与生物功能之间的关系,以揭示基因组信息结构的复杂性及遗传语言的根本规律。以生物芯片为研究基础,以序列比对、统计分析方法、可视化作图、生物聚类、通路分析及启动子预测等方法为手段,在分子水平进行数据挖掘、对疾病进行阐述。利用基因芯片技术和生物信息学方法系统分析肿瘤相关基因及调控机制,是当前功能基因组学的重要研究途径,可从整体的、基因组水平上阐明肿瘤细胞基因表达调控网络。最近,综合使用各种分析手段对芯片表达数据进行分析的统合分析方法(meta-analysis)成为研究者们的热点,这种分析方法不仅降低了错误发现率(falsediscoveryrate,FDR),还克服了单个芯片数据或单个实验室数据存在的缺陷,从而更加全面地从整体上对疾病进行研究。
本研究以EBV感染NPC的三组数据(GSE2370,GSE2371,GSE6472)和EBV感染原发性渗出性淋巴瘤(primaryeffusionlymphoma,PEL)的数据(GSE2149)为分析材料,采用GeneSpring软件筛选EBV复发感染NPC芯片数据的靶标基因,BRBArrayTools软件筛选EBV+/EBV--NPC和EBV+/EBV--PEL芯片数据的差异基因,再结合转录因子及转录因子结合位点(Transcriptionalfactorbindingsite,TFBS)预测、文献挖掘、基因组织选择性分析和基因亚细胞定位等方法对目标基因及其相互作用关系进行预测,从中发现鼻咽癌发病相关基因,构建差异基因相互作用的网络图谱并提出假说,为EBV+-NPC的分子发病机制、药物研发及治疗等更深入的课题提供有意义的探索和依据。主要分为以下三部分:
第一部分:EBV活化复发感染对NPC基因表达模式的影响。以EBV原发感染NPC的两组芯片数据(GSE2370:EBV--NPC/正常鼻粘膜上皮组织;GSE2371:EBV+/EBV--NPC)和EBV不同活化次数NPC的芯片数据(GSE6472:P1/R1/P15/R15)为研究材料,导入GeneSpringGX软件筛选差异基因,然后交叉比较三组数据,得到不同活化次数的NPC差异基因。利用生物学功能聚类、KEGG通路分析、功能注释和TFBS预测等方法对差异基因进行生物学分析和网络图谱的构建。结果筛选到87个EBV感染时的靶标基因和116个复发感染时的差异基因,交叉比较后,获得23个差异基因(meta-A)在两组数据中共同表达,作为EBV活化时复发感染的靶标基因,可能通过两种表达模式(expressionpatterns)发挥作用:一条主要涉及TOP1,DUSP1,DUSP6和RPS28等,另一条是由PITX1,CD9,HOXA9和IMPDH2组成的转录相关环。
第二部分:以EBV+/EBV--NPC(GSE2371)和EBV+/EBV-PEL(GSE2149)两组数据为分析材料研究EBV感染导致不同肿瘤的共同发生通路。同样是EBV感染,最后可能发生不同的肿瘤,交叉比较这些数据,可能获得EBV感染致肿瘤的一条共同通路,有助于理解EBV感染致鼻咽癌的发生机制。从NCBI的GEO数据库下载数据后,将其导入至BRB-ArrayTools分析软件进行标准化及差异基因的筛选和统计学分析,交叉比较两组差异基因,结果获得了45个侯选基因(meta-B)。对meta-B基因进行生物学功能聚类、通路分析、TFBS预测等,结果发现meta-B基因主要涉及LMP1调节的AP-1,NF-κB和JAK/STAT三条信号通路,细胞周期及BZLF1诱导通路,RB/E2F,CDKN1A,DEK和P53的表达改变,可能参与EBV相关的肿瘤细胞的转化过程。
第三部分:构建EBV感染相关的NPC的转录调控网络图谱,并提出假说。结合以上两部分的结果,将两个图谱中的重要节点如:DEK,E2F,RB,LMP1,BZLF1,JUN,NF-κB和MYC等进行反复的文献挖掘,并交叉比较淋巴结组织选择性基因及基因亚细胞定位分析。结果发现EBV感染相关的分子作用通路根源于LMP1和BZLF1。由PITX1,CD9,HOXA9和IMPDH2组成的转录相关环可以通过SP1,STAT3相互联系,BZLF1诱导的RB,E2F和DEK表达改变可能是肿瘤发生的一重要调节通路。综合文献挖掘的结果,我们提出EBV感染相关鼻咽癌发生机制的假说:EBV潜伏感染时,LMP1等占主导的作用,刺激细胞增长、抑制凋亡、阻止裂解复制。EBV活化时,多种因素(P53过表达,γ射线等)可诱导BZLF1表达,高表达的BZLF1通过CDKN1A和P27抑制CDK2的表达,低磷酸化RB/E2F复合物不能释放出E2F,DEK表达下降,激活P53的活性,使细胞进入裂解复制、释放出大量的病毒粒子,进而感染更多的宿主细胞,使细胞发生转化及侵袭能力增强,最终导致宿主细胞死亡和肿瘤的发生及转移。
综上所述,统合分析的生物信息学方法成功地对EBV相关的四组数据进行了分析和研究,筛选获得了两组特征性差异基因(包括meta-A:EBV原发感染和复发感染NPC的差异基因;和meta-B:在EBV依赖的NPC和PEL中同时差异表达基因),并在此基因及转录因子基础上构建了一个EBV感染相关的鼻咽癌细胞转化的网络调节图谱。进一步探讨了EBV感染相关肿瘤的可能目标基因及其相互调节关系,并提出了EBV活化复发感染致肿瘤细胞转化的假说:NPC的形成和发展可能依赖从潜伏进入裂解周期时DEK,CDK,P53,RB和相关转录因子等的调节改变。为进一步深入研究NPC的分子发病机制提供了基础。当然这种结果仍需进一步的有效验证,而且,NPC的发生是一个复杂的过程,其它诸如环境因素、饮食习惯和遗传易感性等也应进一步地考虑。