复杂疾病的风险预测模型研究及遗传变异数据库挖掘

来源 :浙江大学 | 被引量 : 0次 | 上传用户:ft4200770
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在精准医疗时代大背景下,疾病风险预测已成为疾病预防和诊断领域研究的热点,对人类的健康具有革命性的意义。基于疾病易感遗传标记开发疾病风险预测模型是目前最可能实现的一种策略。同时,癌症精准医疗已经走在了精准医疗时代的最前列,癌症个体化治疗已经成为公认趋势。随着大量的癌症易感遗传位点以及靶向用药位点不断被发现,可靠的癌症易感基因及遗传变异位点数据库已经成为了癌症精准医疗的关键。因此,基于上述背景,我们利用本团队已有的欧裔美国人和非裔美国人的吸烟成瘾样本,以及公共数据库中癌症的遗传变异位点,开展了以下三方面的工作:第一,我们以1572名欧裔美国人样本作为研究对象,对其进行吸烟行为与基因型的关联分析,选取94个关联分析中最为显著的SNP,利用一种风险预测算法对样本进行吸烟行为预测,该预测模型可有效地区分吸烟样本和非吸烟样本,其AUC高达0.91。随后基于现有GWAS报道收集的34个易感SNP位点,对样本进行同样的预测,我们发现这些SNP位点无法区分吸烟样本与非吸烟样本。因此我们认为,利用GWAS发现的遗传标记进行疾病风险预测是可行的,但是并不能直接应用公共数据库中的遗传标记进行预测,我们需要根据预测人群的生理和地理分布更细致的划分人群,通过全基因组关联分析寻求针对不同人群的特异性遗传标记集合,并以此利用疾病风险预测算法进行复杂疾病或性状的精准预测。第二,我们以1572名欧裔美国人样本与3371名非裔美国人样本作为研究对象,应用不同的机器学习方法(SVM和RF,logistic回归和LASSO回归)建立吸烟行为的可靠预测模型。对于本次研究的数据集,支持向量机模型的预测性能在各个参数中都优于随机森林模型;基于logistic回归的机器学习模型相比较于LASSO回归,有着更为稳定的表现,泛化能力也更强;而基于非裔美国人样本的预测模型无法在欧裔美国人样本中进行验证。最后,我们结合logistic回归(P<0.01)和LASSO回归(λ=10-3)以及SVM构建了一个包含500个SNP的吸烟行为预测模型,其在AA独立样本测试集中的AUC达到了0.897。该机器学习预测模型的成功建立,能够给其它各类复杂疾病或表型的风险预测研究提供参考。第三,我们利用生物信息学技术,从公共数据库中挖掘出20种常见癌症的249个易感基因,以及易感基因上的3074个致病遗传变异位点,并对致病遗传变异位点进行分类,构建了一个癌症遗传变异数据库。该数据库覆盖了绝大部分癌症,并全面收录了与癌症相关易感基因及遗传变异位点。该数据库极大提高了科研人员和医学工作者对数据筛选的效率,在癌症的遗传学研究中具有重要意义,并且该数据库可为癌症基因检测和靶向药物开发及用药提供参考意义,在癌症精准预防和精准医疗中起着重要的作用。综上所述,我们证明了基于全基因组关联分析开发疾病风险预测的可行性,同时基于机器学习方法也成功构建了复杂性状的风险预测模型,此外,我们构建的癌症遗传变异数据库也将在癌症精准医疗领域研究中发挥重要作用。本课题围绕着精准医疗的核心方向开展研究,对推动精准医疗的发展具有重要的意义。
其他文献
第一部分颅内静脉回流影响急性缺血性卒中患者再灌注治疗结局目的:明确颅内静脉整体回流状态对急性缺血性卒中(AIS)再灌注治疗结局的影响。方法:回顾分析本中心2009年5月至2019年3月期间行头颅多模式CT且接受再灌注治疗的前循环AIS患者。四维CT血管成像(4D-CTA)评估蝶顶窦、大脑中浅静脉、Labbé静脉、Trolard静脉、丘纹静脉、大脑内静脉、基底静脉充盈情况并获得颅内静脉显影评分(CV
生长和溶胀是普遍存在于生物组织和部分软聚合物中的复杂的物理化学反应,往往表现为外在的体积变化和表面失稳演化以及内在的残余应力的积聚。更好地了解其实质或机理不仅能够有助于理解生物组织的生长发育,病变,衰老和死亡,同时可以辅助我们设计相关的工业应用,例如水凝胶的模态自组装和4D仿生打印等。经典体生长模型通过利用乘法分解方法,实现了模拟生长过程中的体积变化和残余应力的积聚现象。其核心在于将总的生长变形分
肌腱异位骨化是以肌腱组织中出现成骨细胞并形成骨组织为特征的临床难治性疾病,常继发于肌腱损伤或手术创伤。肌腱异位骨化可导致不同程度的疼痛、水肿、关节活动受限、肌腱力学性能下降甚至断裂,严重影响患者生活质量。目前,临床上常采用局部注射非甾体类抗炎药、糖皮质激素或冲击波治疗等方法来缓解症状,尚无有效疗法能够治愈肌腱异位骨化。虽然近年来针对肌腱异位骨化的研究揭示了损伤、炎症等因素在病理过程中的重要作用,对
随着我国考古学科的发展,大量土体遗址被发掘出来。由于土遗址暴露在自然条件下,极易遭受损毁和破坏,需加以保护。其中潮湿环境下的土遗址由于受水力作用影响较大而极易发生破坏,因此针对潮湿环境下土遗址改良与修复的材料和方法研究是文化遗产保护工作中的重要组成部分。我国历史文献中所记载的许多传统天然材料,在土体性质改良方面具有良好的处理效果。因此,如何将这些传统天然材料,通过现代科学手段进行研究,并应用在土遗
背景与目的:miR-184-U(突变型的miR-184,r.57c>u)在多种家族性遗传性眼病中被发现,但在这些眼部疾病中,miR-184-U的生物学功能和致病机制仍不清楚。既往的研究表明circRNA可以作为某些miRNA的海绵,但是目前尚无研究探讨miRNA或其突变体是否会影响circRNA的表达。因此,本研究通过使用化学合成的miR-184-U模拟体及miR-184-C(野生型的miR-18
目的目前迫切需要寻找确定治疗骨肉瘤的新分子靶标。环状RNA是一类内源性RNA,广泛存在于哺乳动物细胞中,并在调节基因表达中发挥关键作用,但在骨肉瘤中,环状RNA的潜在分子机制仍知之甚少。在这里,我们评估了骨肉瘤中环状RNA circFAT1的在骨肉瘤发生发展中的功能及特性。方法首先体外实验明确circFAT1在骨肉瘤中环状RNA的特性,评估circFAT1/miR-375/YAP1对人骨肉瘤细胞生
本论文分为两个部分,分别研究了基于聚己内酯明胶纳米纤维的化疗光热治疗协同肿瘤治疗平台和基于聚己内酯明胶纳米纤维的饥饿治疗化疗协同肿瘤治疗平台第一部分以纤维或水凝胶作为主要形式的局部药物传输系统,已成为有效治疗肿瘤的一种技术方式,但由于其治疗功能单一,导致疗效有限,在实践应用中受到挑战。本研究设计并合成了一种基于纳米纤维的多功能局部药物传输系统,可以通过小切口微创手术方式植入体内,发挥治疗肿瘤的作用
胰腺癌是我国乃至全世界范围内最为恶性和致命的癌症之一,死亡率与发病率之比接近1.0,5年生存率极低。胰腺癌往往起病隐匿,缺乏早期症状,多数病例诊断之时已经是中晚期,没有手术治疗指征。药物治疗是胰腺癌患者治疗的重要选择。目前,由奥沙利铂、伊立替康、氟尿嘧啶和亚叶酸钙组成的联合用药方案FOLFIRINOX是晚期胰腺癌药物治疗的一线化疗方案。研究表明,接受吉西他滨单药治疗的胰腺癌患者中位生存时间只有6.
骨肉瘤是一种最常见的骨原发恶性肿瘤,其恶性程度较高,常见于儿童和青少年,其次为老年人(双峰现象),容易发生转移,最常见部位为肺部,而肺转移往往是骨肉瘤治疗失败的主要原因,其5年总生存率不足20%。目前,骨肉瘤肺转移的机制尚不清楚,而免疫疗法等新颖治疗方式仍然存在一定挑战。越来越多的肿瘤免疫学研究聚焦于趋化因子。一方面,趋化因子可以激活和增强各类免疫细胞发生迁移,另外一方面,趋化因子可增强肿瘤细胞增
研究目的胃癌是全球最常见的恶性肿瘤之一,2018年统计确诊的胃癌新发病例就超过100万例。在中国胃癌的发病率和死亡率均高居恶性肿瘤的第2位。胃癌发病隐匿,不易早期发现,预后极差。抑癌基因的表观遗传异常是胃癌发生的重要机制之一,尤以DNA甲基化最为普遍。DNA甲基化修饰是导致抑癌基因失活的主要原因之一。筛选出因表观遗传改变而失活的抑癌基因,明确其作用机理,将有助于了解胃癌发生发展,为将来的临床诊治研