论文部分内容阅读
研究背景:乳腺癌是全世界范围内女性发病率最高的一类恶性肿瘤。目前,尚无理想的体外分子标志物可用于乳腺癌的早期诊断。大量研究表明:伴随肿瘤的发生与发展,患者肿瘤组织及体液中蛋白质糖基化水平常发生异常改变。本研究从唾液检测入手,利用高灵敏度且高通量的糖链检测技术——凝集素芯片,对健康女性志愿者(healthy volunteers,HV)、良性乳腺肿瘤/囊肿患者(benign breast diseases patients,BB)、Ⅰ期乳腺癌患者(patients with breast cancer in Ⅰ stage,BC-Ⅰ)以及 Ⅱ 期乳腺癌患者(patients with breast cancer in Ⅱ stage,BC-Ⅱ)的唾液蛋白质糖链结构进行比较分析,期望发现异常的唾液蛋白质糖链结构,讨论其作为检测指标应用于乳腺癌患者早期诊断的可能性。实验方法:本研究首先应用凝集素芯片,对HV、BB、BC-Ⅰ以及BC-Ⅱ混合唾液样本(各30例混合)中的蛋白质糖链结构进行分析,比较四组混合唾液中蛋白质糖链结构的差异,并通过凝集素印迹实验验证;随后,应用凝集素芯片对新收集的139例训练集样本(36例HV,35例BB,36例BC-Ⅰ以及32例BC-Ⅱ)进行个例分析,筛选可用于鉴别诊断BB、BC-Ⅰ和BC-Ⅱ唾液样本的候选凝集素,并利用二元逐步Logistic回归分析构建诊断模型;最后,在127例验证集样本(31例HV,30例BB,30 例 BC-Ⅰ 以及 36 例 BC-Ⅱ)中通过 ROC 曲线分析(receiver operating characteristic curve)评估诊断模型对BB、BC-Ⅰ和BC-Ⅱ的鉴别能力。实验结果:1.混合唾液样本凝集素芯片结果表明,11种凝集素的归一化荧光强度值(normalized fluorescent intensities,NFIs)在 HV、BB、BC-Ⅰ 以及 BC-Ⅱ 混合样本中具有显著差异:其中5种凝集素(DBA、PNA、PHA-E+L、UEA-I和PWM)特异性识别的 αGalNAc、GalNAcαl-3(Fucαl-2)Gal、Galβl-3GalNAcα、平分型 GlcNAc、多天线型N-聚糖、Fucαl-2Ga1β1-4Glc(NAc)以及分支(LacNAc)n糖链在至少一种乳腺疾病患者唾液中较HV表达水平发生改变。另外6种凝集素(MAL-Ⅰ、ECA、NPA、BPL、PTL-Ⅱ 和 BS-Ⅰ)特异性识别的 Galβl-4/3GlcNAc、High-Man、Manαl-6Man、Ga1β1-3GalNAcα-Ser/Thr 以及 Galαl-3/6Gal/Glc 糖链结构表达水平在 BB、BC-Ⅰ或BC-Ⅱ混合唾液样本中具有显著性差异。随后利用4种凝集素(PHA-E+L、NPA、MAL-Ⅰ以及BS-Ⅰ)进行凝集素印迹实验,证明了混合唾液样本芯片结果的准确性。2.经过训练集个例唾液凝集芯片进一步筛选,11种凝集素中的8种凝集素(PNA、PHA-E+L、UEA-Ⅰ、PWM、MAL-Ⅰ、NPA、BS-Ⅰ 和 PTL-Ⅱ)以及 PHA-E 作为候选凝集素进行ROC曲线分析。结果发现仅有PHA-E+L和PWM具有较高的鉴别诊断能力(ROC曲线线下面积(AUC)>0.70),表明单一凝集素无法应用于BB、BC-I和BC-Ⅱ样本的鉴别。因此基于9种候选凝集素,通过Logistic回归构建4个诊断模型:Model BD、Model BB、Model BC-Ⅰ及Model BC-Ⅱ用于鉴别不同乳腺疾病患者。经验证集个例样本验证,Model BD获得了较好的诊断效果(AUC:0.902、灵敏度:0.823、特异性:0.839),能够准确鉴别出96例乳腺疾病患者中的79例,31例HV中的26例;Model BB(AUC:0.796、灵敏度:0.727、特异性:0.767)可准确鉴别出30例BB中的23例,66例乳腺癌患者中的48例;此外,Model BC-Ⅰ(AUC:0.781、灵敏度:0.700、特异性:0.864)可准确鉴别出30例BC-Ⅰ组中的21例,其余两个患病组66例样本中的57例;而Model BC-Ⅱ(AUC:0.759、灵敏度:0.861、特异性:0.550)可准确鉴别出36例BC-Ⅱ组中的31例,其余两个患者组60例样本中的33例。验证集中诊断模型的ROC-AUC值均高于0.75,仍能具有较高的鉴别诊断能力,表明乳腺癌患者唾液中蛋白质的异常糖链结构有望成为潜在的体外检测标志物,用于乳腺癌患者的早期筛查。