论文部分内容阅读
卵巢肿瘤有多种组织学亚型,不同亚型的临床特征和预后存在较大差异,其中浆液性囊腺癌为最常见的卵巢恶性肿瘤,占40%-50%。因此,本研究选择将其作为研究对象,使用美国国立癌症研究所(National Cancer Institute,NCI)的监测、流行病学和最终结果(Surveillance,Epidemiology,and End Results,SEER)数据库和癌症基因组图谱卵巢癌(The Cancer Genome Atlas Ovarian,TCGA-OV)数据库,探讨卵巢浆液性囊腺癌患者的临床特征和基因表达谱特征与预后的关系,同时探讨其生存模式并确立更为精准的生存时间分组参考值。第一部分预测卵巢浆液性囊腺癌生存概率的列线图制备目的:卵巢浆液性囊腺癌是女性生殖系统常见恶性肿瘤,多种临床和病理因素均可能影响患者预后。本研究旨在建立卵巢浆液性囊腺癌患者的临床特征列线图模型,并验证其预测准确性和可靠性,为预测患者预后提供依据,也为本文后续研究奠定基础。方法:1.在美国国立癌症研究所的监测、流行病学和随访结果(SEER)数据库中检索1992年至2013年间美国20个州确诊的卵巢浆液性囊腺癌,提取数据完整的病例信息,包括确诊年龄、确诊年份、种族、临床期别、肿瘤侧别、治疗方式、组织分级、生存时间、生存状态、死亡原因等临床信息。2.按临床特征分组绘制患者的Kaplan-Meier(K-M)生存曲线,并用Log-rank检验比较组间生存时间差异。3.采用单因素Cox回归分析患者的结局事件(死亡)与临床变量的相关性,将结果中具有统计学差异的变量(P<0.05)纳入多因素Cox比例风险模型,并在此基础上建立列线图生存预测模型。4.采用Bootstrap自抽样法对列线图生存预测模型的效能进行内部验证。将上述患者数据进行1000次重采样得到校准曲线(Calibration curve),直观的展示预测生存率与实际生存率之间的一致性,同时避免模型的过度拟合;采用C指数(Concordance index,C-index)评估该模型的准确度。结果:1.从SEER数据库提取到10680例数据完整的卵巢浆液性囊腺癌临床信息,患者平均年龄62.0±12.078岁(范围17-96岁)。生存时间(overall survival,OS)中位数是4.2年,最长生存时间24.8年以上。1年、5年和10年生存率分别为77%、39%和25%。2.Log-rank检验结果提示,卵巢浆液性囊腺癌患者的确诊年龄、确诊年份、临床期别、肿瘤侧别、治疗方式和组织学分级与预后相关(P<0.001)。3.单因素和多因素Cox比例风险回归分析的结果,均显示年龄≥62岁、临床晚期是预后不良因素,确诊年份2003-2013、单侧受累、手术治疗和组织学低级别是预后有利因素,同时,显示患者种族不是预后影响因素。4.列线图预测模型包括6个独立临床特征,即确诊年龄、确诊年份、临床期别、肿瘤侧别、治疗方式和组织分级。对其预测效能的进行验证,结果显示,C-index为0.663,提示模型的预测准确性中等,校准曲线提示预测生存率与实际生存率之间具有较好的一致性,但其预测1年、5年和10年的准确度不一。小结:1.长期生存的卵巢浆液性囊腺癌患者,最长生存时间大于24.8年。2.列线图模型包括患者的确诊年龄、确诊年份、临床期别、肿瘤侧别、治疗方式和组织分级这6个影响卵巢浆液性囊腺癌预后的独立因素。3.基于临床特征建立的列线图模型,预测的患者生存率与实际生存率的一致性呈中等水平,提示除临床变量外,尚存在其他因素,如基因表达谱,可能影响预后,激励我们进行下一部分的研究。第二部分卵巢浆液性囊腺癌生存模式建立和分组参考值确立目的:大部分卵巢浆液性囊腺癌患者生存期小于5年,少部分患者可长期生存。但关于长期生存尚无统一标准,目前相关研究均选定某个固定生存年限作为分组依据,如3年、5年、7年或10年等。为探索其长期生存影响因素,需明确患者生存时间分组的参考值。本研究探讨卵巢浆液性囊腺癌患者的生存模式,希望在此基础上确立精准的生存时间分组参考值,为进一步探讨基因差异奠定基础。方法:1.应用美国国立癌症研究所的检测、流行病学和随访结果(Surveillance,Epidemiology,and End Results,SEER)数据库中SEER 18Regs数据集,检索满足下列纳入条件的病例,包括:确诊年份为1992年至2013年;国际肿瘤学疾病分类第3版(International Classification of Disease for Oncology,3rd Edition,ICD-O-3)组织学代码8441;ICD-O-3/WHO 2008部位代码C56.9;生物学行为代码为Malignant。排除生存信息不全病例。2.根据患者的各临床特征分别绘制生存时间密度曲线,包括确诊年龄、确诊年份、种族、肿瘤侧别、居住地区、临床期别、组织分级、治疗方式和死亡原因等,探讨卵巢浆液性囊腺癌患者的生存模式及规律。3.根据Tukey检验异常值的原理,以发生事件(死亡)患者的生存时间绘制箱盒图,异常值即为长期生存者。长期生存者参考范围定为生存时间>(Q3+1.5×IQR),普通生存者参考值范围定为生存时间在Q1至Q3之间。4.应用分组参考值,在上述13929例卵巢浆液性囊腺癌患者中提取出长期生存和普通生存两组。结果:1.本研究纳入13929例卵巢浆液性囊腺癌病例,中位年龄63岁。绘制出各临床特征的生存时间密度曲线。2.生存时间密度曲线呈双峰分布,两峰分别与普通生存者和长期生存者相对应。患者确诊年龄对生存时间密度曲线左侧峰(普通生存者)形态影响较大。长期生存者和普通生存者的生存时间参考值随年龄增加而降低:长期生存者参考值下界从9.83年降至4.33年,普通生存者参考值下界从2.08年降至0.08年,上界从5.17年降至1.83年。3.在13929例卵巢浆液性囊腺癌患者中验证分组参考值的分组效果,45.5%的患者可以分入长期生存组(1288例)或普通生存组(4908例)。小结:1.卵巢浆液囊性癌患者的生存时间密度曲线表现为“双峰分布”特征,两峰分别对应普通生存者和长期生存者。2.应用Tukey异常值检测方法可确定分组参考值,同时考虑确诊年龄的影响。3.应用本研究确立的参考值分组,研究队列的数据利用率较高,可达44.5%。第三部分卵巢浆液性囊腺癌长期生存关键基因鉴定及功能分析目的:具有一种或多种临床预后不良因素的卵巢浆液性囊腺癌患者,仍有可能成为长期生存者,提示其他因素如遗传因素可能对预后有决定性影响。本研究应用第二部分确立的的一系列新的分组参考值,从卵巢浆液性囊腺癌患者中筛选出长期生存者和普通生存者,鉴定其长期生存相关的基因表达谱,并进行功能分析。方法:1.从美国癌症基因组图谱卵巢癌数据库(TCGA-OV)hg38数据集提取卵巢浆液性囊腺癌病例的临床信息。根据第二部分确定的分组参考值,从中提取长期生存者(Long-term survivors,LTS)和普通生存者(Normal-term survivors,NTS)。2.下载LTS和NTS患者的基因表达矩阵,标准化和过滤后,利用Edge R分析流程鉴定差异表达基因(Differentially expressed genes,DEGs),筛选标准│log FC│≥1且FDR≤0.001。利用DAVID数据库对DEGs进行基因本体(Gene Ontology,GO)功能富集分析和京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)进行通路富集分析。使用Quick GO在线工具将GO功能注释结果可视化。从STRING数据库中提取DEGs相关蛋白-蛋白相互作用(protein-protein interaction,PPI)网络,并使用Cytoscape程序中的Cyto Hubba包鉴定枢纽(Hub)基因。结果:1.本研究从TCGA-OV hg38数据集的374例卵巢浆液性囊腺癌患者中,根据新的分组参考值,提取出19例LTS、105例NTS,两组患者临床基线无统计学差异。2.对LTS、NTS两组患者肿瘤组织进行基因差异表达分析,鉴定出长期生存相关的157个DEGs,包括155个上调基因和2个下调基因。3.对以上157个DEGs进行功能分析,发现上调基因富集在80个GO功能条目和11个KEGG通路中,功能与能量和物质代谢相关,如蛋白质吸收、消化和代谢;还与染色质沉默、ERK1和ERK2级联的调节以及MAPKKK的调节信号通路相关。ALB和POMC是共同的枢纽基因。小结:蛋白质合成代谢可能对卵巢浆液性囊腺癌患者长期生存至关重要,并受MAPK/ERK信号通路激活和染色质沉默的调控。对ALB和POMC等枢纽基因及分子机制的深入研究有助于卵巢浆液性囊腺癌的有效治疗。