论文部分内容阅读
目的:认知功能障碍(cognitive impairment)的风险预测对痴呆的早期预防和干预具有重要意义。机器学习已成为数据挖掘的重要手段,在疾病风险预测中表现良好。本研究旨在探究农村老年人认知功能障碍现状及其相关风险因素,并基于风险因素和日常活动能力,采用机器学习算法构建认知功能障碍风险预测模型,有效识别高危人群,促进认知功能障碍的早诊断早干预。
方法:本研究采用问卷调查法,通过一对一访谈的方式在浙江省宁波市某镇60岁及以上老年人开展认知功能障碍调查(N=1428),评估工具为蒙特利尔认知评估量表(Montreal Cognitive Assessment, MoCA)和日常生活能力量表(Activities of Daily Living, ADL),社会人口学信息和可能的危险因素采用自编问卷进行收集。依据量表评估结果将参与者分为认知障碍组和正常组,使用非参数检验、多因素二元Logistic回归(逐步后退法)和支持向量机、决策树、随机森林三种机器学习算法进行数据分析。
结果:农村老年人中认知功能障碍发生率为29.97%,轻度认知功能障碍和痴呆患病率分别为25.21%和4.76%,且年龄越大,患病率越高。非参数检验显示,两组在年龄、受教育水平、受教育年限、性别、婚姻状态、居住方式、职业、吸烟、饮酒、脑卒中和除进食外其余日常生活能力上存在显著差异(P<0.05)。Logistic回归显示,年龄、离异、农民或无业和需要人照顾是认知功能障碍的危险因素,受教育年限和饮酒是其保护因素。以危险因素进行预测模型构建时,支持向量机、决策树、随机森林三种算法预测性能F1分数分别为0.831、0.832和0.839,ROC曲线下面积AUC分别为0.675、0.669和0.671,在综合考虑日常活动能力后模型预测性能明显提升,F1分数分别为0.853、0.849和0.863,ROC曲线下面积AUC在0.705到0.721之间,随机森林模型预测性能最佳(F1=0.863,AUC=0.721),受教育情况、年龄、体质指数、职业、运动和罹患心血管疾病等是随机森林模型构建预测的重要变量。
结论:农村老年人中认知功能障碍患病率高,与年龄、受教育程度、既往职业、心血管因素、运动等多因素相关,可采用随机森林算法构建预测模型,对早期识别高危人群、促进认知功能障碍的早期诊断与治疗具有重要意义。
方法:本研究采用问卷调查法,通过一对一访谈的方式在浙江省宁波市某镇60岁及以上老年人开展认知功能障碍调查(N=1428),评估工具为蒙特利尔认知评估量表(Montreal Cognitive Assessment, MoCA)和日常生活能力量表(Activities of Daily Living, ADL),社会人口学信息和可能的危险因素采用自编问卷进行收集。依据量表评估结果将参与者分为认知障碍组和正常组,使用非参数检验、多因素二元Logistic回归(逐步后退法)和支持向量机、决策树、随机森林三种机器学习算法进行数据分析。
结果:农村老年人中认知功能障碍发生率为29.97%,轻度认知功能障碍和痴呆患病率分别为25.21%和4.76%,且年龄越大,患病率越高。非参数检验显示,两组在年龄、受教育水平、受教育年限、性别、婚姻状态、居住方式、职业、吸烟、饮酒、脑卒中和除进食外其余日常生活能力上存在显著差异(P<0.05)。Logistic回归显示,年龄、离异、农民或无业和需要人照顾是认知功能障碍的危险因素,受教育年限和饮酒是其保护因素。以危险因素进行预测模型构建时,支持向量机、决策树、随机森林三种算法预测性能F1分数分别为0.831、0.832和0.839,ROC曲线下面积AUC分别为0.675、0.669和0.671,在综合考虑日常活动能力后模型预测性能明显提升,F1分数分别为0.853、0.849和0.863,ROC曲线下面积AUC在0.705到0.721之间,随机森林模型预测性能最佳(F1=0.863,AUC=0.721),受教育情况、年龄、体质指数、职业、运动和罹患心血管疾病等是随机森林模型构建预测的重要变量。
结论:农村老年人中认知功能障碍患病率高,与年龄、受教育程度、既往职业、心血管因素、运动等多因素相关,可采用随机森林算法构建预测模型,对早期识别高危人群、促进认知功能障碍的早期诊断与治疗具有重要意义。