论文部分内容阅读
癌症作为世界范围内一个迅速发展的健康问题,对人类的危害和经济威胁日益增加。在精准医学中,准确的风险评估是实施风险筛查和预防性治疗的先决条件,而癌症发生风险预测模型的研究开发有助于癌症的早期发现和治疗。目前大量研究针对癌症发生风险构建了相关生物信息学预测模型,但是缺少有效的资源整合。因此,癌症发生风险预测模型知识库的建立与分析具有重要意义。本课题的研究主要从三个方面展开:第一部分,我们借助PubMed数据库对符合条件的文章进行筛选处理,构建了癌症发生风险预测模型知识库CRPMKB(http://www.sysbio.org.cn/CRPMKB/)。目前知识库中共收录371条模型数据,包含肺癌、乳腺癌、前列腺癌、卵巢癌、结直肠癌和宫颈癌六种癌症类型。第二部分,我们探究了地区差异、癌症类型和模型类型对癌症发生风险预测模型准确性的影响。通过卡方检验分析发现癌症发生风险预测准确性受地区差异和癌症类型的影响较大,但与模型类型关联性较小。本研究表明,根据特定人群特征和癌症类型开发更具有针对性的模型,会进一步提高癌症风险模型预测的准确性。第三部分,本课题主要针对癌症发生风险预测模型的变量进行研究。本课题将模型变量分为环境、行为生活方式、生物遗传和临床检查四类,结果发现各类变量在不同癌症类型中的分布情况存在差异;进一步对癌症风险模型涉及的基因数据进行汇总,并以肺癌为例对癌症风险模型涉及的基因进行IPA代谢通路等富集分析,结果显示这些基因显著富集在p53信号(p53 Signaling)和芳基烃受体信号(Aryl Hydrocarbon Receptor Signaling)等与癌症和特异性疾病相关的通路上。目前在医学界被广泛推崇的“4P”模式是预防性(Preemptive)、预测性(Predictive)、个体化(Personalized)和参与性(Participatory)。本课题不仅建立了癌症发生风险预测模型知识库,为病患、医生和研究人员等提供了便利和帮助;而且基于系统的思维对知识库中的模型信息进行分析,为癌症早期诊断和个性化治疗提供了新的思路和策略,具有一定的理论价值和现实意义。