论文部分内容阅读
隐睾(Cryptorchidism)是儿童泌尿生殖系统常见的先天性疾病,是男性不育、睾丸肿瘤发生的危险因素之一,隐睾的发生与多种因素密切相关,其中基因的改变对隐睾的发生起着重要作用,大量研究证实隐睾症形成与基因的差异表达有关。因此,从转录组水平探索新的隐睾差异表达基因,研究隐睾患儿发生隐睾风险的易感基因,进一步挖掘此类易感基因与隐睾症发生发展之间的关系,最终探讨隐睾症的发病机制,为隐睾症的研究提供新的指导与方向。第一部分 基于高通量测序技术的隐睾患儿转录组学初步研究转录组(transcriptome)是指所有转录产物的统称,从广义上讲,转录组是指在特定的生理条件下,某一物种中所有转录产物的总和。主要分为几个部分,即信使RNA、核糖体RNA、转运RNA以及非编码RNA。蛋白质的表达主要用于行使细胞功能,而蛋白质组是细胞功能与细胞状态两者最为直观的描述,近年来,转录组逐渐成为基因表达研究的最重要方式之一,转录组是基因组信息与蛋白质组两者相互转化的必经阶段,其调控水平的研究亦逐渐增多,转录组调控也是生物体最重要的调控方式。本研究中将隐睾患儿作为研究对象进行转录组测序,采用Illumina HiSeqTM高通量转录组测序平台RNA-Seq技术对隐睾患儿的隐睾组织进行测序。RNA-seq即运用转录组测序技术,把mRNA,smallRNA,and NONcoding RNA等或者其中一部分用高通量测序技术把它们的序列测出来,并反映出它们的表达水平。该项技术可以全面快速准确地获取隐睾患儿的转录组序列信息,通过人类全转录组测序比对揭示隐睾患儿的差异基因和特征,建立其转录组学研究的平台。本部分研究主要结果如下:为了研究隐睾患儿的隐睾组织与正常对照睾丸组织中全基因组的转录谱,我们临床活检了6例隐睾患儿的隐睾组织作为实验组,和2例因睾丸外伤的患儿坏死组织边缘的少许正常睾丸组织以及活检了 1例嵌顿疝患儿的睾丸组织作为对照组。实验利用RNA-seq技术对9例睾丸组织进行转录组测序,然后采用HISAT2软件对RNA-seq数据进行比对,Mapping结果统计显示转录组Mapping率0.957(0.956-0.959),与人类全转录组测序一致。我们将过滤后的Clean Reads进行Mapping和基因组结构的分析,分析结果显示9例睾丸组织基因组结构主要分布于编码区(CDS,Coding Sequence)和外显子(Exon,Expressed Region)。为了更好地研究表型相关的基因表达情况,我们需要了解隐睾组和正常对照组间差异基因的情况。差异筛选标准选用Log2FC>1或<-1,P<0.05,结果提示显著性差异表达mRNA有6145个,显著上调3815个,显著下调2330个。对于差异筛选的基因在不同样本中的差异情况,我们利用差异基因对不同样本进行聚类,以及不同基因进行聚类,帮助我们对于其生物学意义进行初步探究。接着我们采用Fisher对显著差异基因进行显著性功能注释和Pathway显著性分析(GO-Analysis),对其中的显著差异基因,构建其差异调控网络(GO-Term),分析结果发现显著性Pathway最终指向的网络中核心的Pathway,比如钙离子信号转导通路、细胞周期信号转导通路以及细胞代谢相关的信号通路。综上所述,本研究从基因转录组水平系统研究了隐睾患儿的隐睾组织与正常睾丸组织,筛选两者的差异表达基因,并对筛选出的差异表达基因进行功能注释、通路分析及互作网络调控分析等。本研究为隐睾患儿组织转录组学提供了宝贵的遗传资源与材料,并且有助于提高对人类转录组遗传结构的认识和理解。第二部分 基于多组学整合分析筛选隐睾风险的易感基因生物信息学是一门将生命科学与计算机相结合的学科。随着高通量技术的兴起,生物信息学亦随之逐渐发展起来。生物信息学旨在通过运用计算机及统计方法去分析分子生物数据而解决生物学问题。生物信息学涉及生物研究众多领域中,对其中所涉及的原始数据进行进一步分析,从中提取出有用的可靠结果,TCGA和GEO就是其中比较常用的综合数据库。基于GEO和TCGA数据库进行数据挖掘,对挖掘的大数据进行整理和分析,筛选感兴趣的数据集,寻找差异基因、通路及功能富集分析,蛋白-蛋白相互作用(PPI)网络构建和模块分析,进一步筛选出关键基因(易感基因,hub gene),然后获取其中关键的分子以验证分子表型。生物信息学相对于传统生物实验是一条高效的方法途径,在提升实验效率的同时,能够节省人力与物力。本部分的主要结果如下:我们首先采用生物信息学方法对数据库GEO进行挖掘,筛选出来源于睾丸的一组隐睾的基因表达芯片谱:GSE25518,此组基因表达谱数据来源于GPL570。该表达谱GSE25518由19个隐睾患者样本与4个正常样本构成。对测序结果与上述GSE25518微阵列数据集进行综合分析,测序结果中差异表达基因有6145个,GSE25518微阵列中差异表达基因有700个,最终经过绘制Venn图发现两者的共同差异表达基因为108个。将108个共同表达基因进行进一步分析,通过DAVID生物信息学分析,对其功能进行分类;使用STRING蛋白互作数据库,构建108个共同表达基因的蛋白互作网络,从生物信息学分析的层面上得到了 OFD1、NEK2、AHI1、ALMS1、MZT2B5个Hubgenes,且均明显下调。将筛选出的易感基因在我们测序的9例正常对照与隐睾组织中的表达量进行比对,发现隐睾组织中MZT2B、NEK2表达下调,而AHI1、ALMS1与OFD1表达上调。人类蛋白质图谱分析结果表明AHI1、ALMS1、MZT2B与NEK2基因可能与隐睾的发生密切相关。而NEK2在mRNA和蛋白水平都有特异性表达,最后通过基因网站分析和功能预测,我们确定了 NEK2为候选基因,并试图进一步证实NEK2作为隐睾患儿发生隐睾风险的易感基因可能发生的表达及功能变化。综上所述,本课题为了获得与隐睾患儿发生隐睾风险的相关差异表达基因,我们利用多组学整合分析的方式,分别从基因组学和蛋白组学等方面开展数据挖掘和筛选工作,可以有效地避免不同人群,不同种族等因素对研究结果产生的影响,更加有利于最终寻找到与隐睾疾病相关的因素。本课题利用生物信息学分析方法,大规模对综合数据库进行关键词检索和数据挖掘,得到与隐睾患儿发生隐睾风险的基因表达数据集,同时结合前期隐睾患儿标本的基因测序结果,合并筛选得到的所有数据集的基因数据,通过整合分析筛选出所有数据集的共同差异表达基因,对筛选出的基因表达进行进一步差异分析,最终筛选得到隐睾患儿发生隐睾风险的易感基因。第三部分 隐睾风险易感基因NEK2在小鼠隐睾模型中表达变化及其参与细胞凋亡的研究在第二部分内容,我们课题组从生物信息学分析的层面上得到了 OFD1、NEK2、AHI1、ALMS1、MZT2B 5个Hub基因,而NEK2在mRNA和蛋白水平都有特异性表达,通过基因网站分析和功能预测,最后我们确定了 NEK2为候选基因,并试图进一步证实NEK2作为隐睾患儿发生隐睾风险的易感基因可能发生的表达及功能变化。本部分实验内容旨在观察小鼠隐睾模型隐睾组织中隐睾风险易感基因NEK2 mRNA的变化特点,NEK2蛋白表达定位及表达水平变化情况,初步探讨其在睾丸组织细胞凋亡中的作用。本部分的研究结果如下:小鼠隐睾模型构建成功后在前6d睾丸大小变化不大,第6d开始,睾丸明显变小且随时间推移逐渐越来越小,15d时睾丸呈萎缩状态。结合形态学观察,HE染色结果发现随着时间的推移曲精小管内精原细胞、初级精母细胞和精细胞损伤越严重。至15d时基本无正常精细胞,肌样细胞随时间推移损伤亦越严重,15d时很薄的基膜呈现增厚改变。Tunel检测结果显示细胞凋亡细胞数随着时间推移先上升后下降,前3d的凋亡细胞数目不多,从第6d起开始凋亡细胞数目急剧增加,至第9d时凋亡细胞到达最高峰后下降。RT-PCR的结果显示隐睾建模术后第6d NEK2 mRNA表达量逐渐上升,第6d表达量最高之后随时间推移逐渐下降第15d降至最低,并显著低于正常对照组。免疫组化结果显示正常睾丸组织及隐睾组织中,NEK2蛋白表达于细胞核及细胞质内,NEK2蛋白阳性表达随时间推移先上升后下降,前6d表达逐渐升高,第6d表达达到峰值,之后表达下降。综上所述,本课题利用多组学整合分析的方式开展数据挖掘和筛选工作,通过整合分析筛选出数据集的共同差异表达基因,最终差异分析筛选得到隐睾患儿发生隐睾风险的易感基因NEK2,小鼠隐睾模型发现NEK2的异常表达可能通过细胞凋亡作用导致隐睾症患者的不育。我们的研究为临床上隐睾症的治疗、预防不育及睾丸肿瘤等隐睾后遗症提供新的方向,并提出NEK2用作诊断隐睾和预后的标志物以及男性不育和生殖系统疾病的治疗靶点。