论文部分内容阅读
背景与目的:肺癌作为世界范围内最常见的恶性肿瘤之一,其发病率和死亡率均位列全球第一位,严重威胁人类生命健康,给社会带来沉重的疾病负担,是亟需解决的重大公共卫生问题之一。非小细胞肺癌(non-small cell lung cancer,NSCLC)约占肺癌全部病理类型的80%,主要由腺癌、鳞癌和大细胞癌构成。NSCLC患者确诊时通常位于疾病中晚期,手术治疗一般不是其最佳的选择,并且患者对放化疗这类主要的治疗方式不敏感,5年生存率低,约为15%。目前NSCLC具体的发病机制尚不明确,并且缺乏灵敏特异的无创性生物标志物对其进行有效的诊断。非编码RNA(non-coding RNA,ncRNA)的异常表达与恶性肿瘤的发生发展密切相关。近些年来随着高通量测序技术的不断成熟和生物信息学的不断发展,越来越多的环状RNA(circular RNA,circRNA)在多物种(人类、黑腹果蝇、线虫等)中被识别和鉴定出来,扩充了ncRNA家族的种类和功能。circRNA中丰度高者,甚至超过其线性mRNA,部分被报导具有微小RNA(microRNA,miRNA)海绵体的作用而参与到内源性竞争性RNA(competing endogenous RNA,ceRNA)调控网络中。circRNA为闭合环形结构,不具有3’端ploy-A尾因而结构稳定不易被RNase R所降解,能够稳定存在于人体组织和血液中。同时具有组织细胞和发育阶段特异性表达的特征,与疾病的发生发展密切相关,具备作为恶性肿瘤等疾病生物标志物的潜质。因此,本研究初步构建NSCLC组织中circRNA的差异表达谱,以期为后续肺癌相关circRNA的研究提供参考。同时评估其中显著差异表达的circRNAs作为外周血中无创性诊断标志物的可行性,并初步探索其在NSCLC发生中的生物学功能。方法:本课题研究设计包含两部分内容:(1)组织中circRNA表达谱研究阶段:采用Illumina公司二代测序平台Hiseq1500,针对10例NSCLC新发患者的癌和癌旁组织RNA进行全转录组二代测序,通过生物信息学算法CIRCexplorer来识别鉴定circRNAs,构建circRNA表达谱。识别到的circRNA其接合位置(junction)处在单样本中的reads数超过2个,则认为该circRNA真实存在。采用R平台下的DESeq2软件进行差异表达分析,筛选出显著差异表达的circRNAs,并且基于网络数据库Metascape对差异表达circRNAs的本体基因进行通路富集分析。(2)血浆circRNA鉴定及功能初探阶段:结合血浆circRNA的公共数据库,将差异表达的circRNAs在对应肺癌患者血浆中进行验证,并且在50 vs 50样本量的病例对照血浆中进行相对定量,评估其作为NSCLC生物标志物的可行性。生物学机制研究结合了体外细胞功能实验(细胞增殖实验、迁移和侵袭)和生物信息学分析,以此评价候选circRNA在肺癌发生过程中的可能发挥的生物学功能。结果:测序筛选阶段构建NSCLC组织中circRNA表达谱共鉴定到5471个circRNA,其中120个在癌组织中显著上调表达,65个在癌组织中显著下调表达(Fold change≥2,P<0.05)。185个显著差异表达的circRNAs的本体基因被富集到小GTPase介导的信号传导通路和DNA损伤修复通路等肿瘤相关通路中。结合血浆circRNA数据库得到可能在血浆中上调表达的前10位circRNAs,其中circFARSA在血浆中丰度最高。qRT-PCR(quantitative real-time PCR,qRT-PCR)结果显示其表达水平在组织与血浆中一致性较好(r=0.64,P<0.05),病例组显著高于对照组(Fold change=1.96,P<0.001)。受试者工作特征曲线(receiver operating characteristic curve,ROC)分析显示曲线下面积(area under curve,AUC)达到了0.71,灵敏度为64%,特异度为66%,提示circFARSA对NSCLC具有一定诊断价值。体外细胞功能实验证明在A549细胞系中过表达circFARSA可以促进A549细胞迁移和侵袭的能力。生物信息学预测提示circFARSA靶向的miRNAs(mi R-330-5p和miR-326)可以调节CCND1等基因的表达参与到NSCLC的发生发展过程中。结论:本研究首次基于二代测序技术构建了NSCLC特异的circRNA的表达谱,并基于血浆样本开展了病例对照研究证实circFARSA可能成为NSCLC新的生物标志物,体外细胞功能实验和生物信息学预测提示circFARSA可能参与NSCLC的侵袭和转移的恶性表型。