论文部分内容阅读
我国较高的卒中发病率、患病率、复发率、致残率和死亡率,带来了严重的医疗经济负担。对于卒中高危人群来说,全周期健康管理以及全流程医疗服务的需求渐逐增长,而做好未病先防,有利于促进主动健康理念的践行和卒中风险管理的开展。另外,“健康中国”的国家战略和互联网医疗的科技环境,为医疗服务提供良好的政策支持和技术支撑,促进医疗资源的优化配置,优化“院前-院中-院后”的医疗管理。然而,现有卒中预测研究的可行性、适用性和实践性较为有限。因此,开展卒中风险预测的相关研究,能够促进全人群的卒中风险管理,并利于卒中风险预警体系的完善。本研究主要基于真实世界、医疗大数据、大数据分析以及监督学习等理论知识,探寻卒中的关键影响因素,并采用基于标准和集成学习算法的人工神经网络模型进行卒中的风险预测研究。首先,通过深入的文献研究,筛选人口学资料、检验指标和临床病史等三方面的卒中影响因素;其次,收集真实世界的医院临床患者和体检人群源数据,对其进行集成、规范和填补等预处理操作;再次,通过统计学方法对病例数据进行基本资料分析、单因素分析和多因素回归分析,提取与卒中密切相关的关键影响因素,并以此作为模型的预测变量;最后,构建多层感知机(MLP)和径向基函数(RBF)的标准(Standard)算法模型,再利用Bagging和Boosting的集成算法分别建立人工神经网络的集成模型,并对预测模型结果进行对比、分析和验证。本文采用5936例医院患者的真实数据进行卒中的风险评估研究,研究结果表明:第一,基于文献研究得到22个卒中影响因素,并通过统计学分析得到12个模型预测变量;第二,通过对比分析发现,无论采用Standard算法或Bagging和Boosting算法,MLP模型的综合性能均高于RBF模型;第三,相比于Standard算法模型,基于Bagging和Boosting算法的集成模型预测和泛化能力较好,且Boosting算法模型高于Bagging算法;第四,基于MLP和RBF的卒中预测模型均认为,总胆固醇(TC)、卒中史(HS)、血肌酐(Scr)、收缩压(SBP)、年龄(Age)、心脏病(HD)和白细胞(WBC)等7个关键预测变量的重要性依序降低。