论文部分内容阅读
目的:本研究拟采集针对慢性肾脏病的慢病管理相关诊疗信息,构建慢病管理疾病风险预测模型,对预测模型进行数据分析并有效验证,为更优的管理方式提供理论依据,改善患者预后水平。方法:本研究采用回顾性数据分析方法,以2012年1月1日至2018年12月31日,于广东省中医院慢病管理门诊规律随访的慢性肾脏病4期患者作为研究对象,全面收集研究对象的人口统计学资料、实验室检查结果、中医症状与辨证分型、中医慢病管理实施情况、服用药物情况等相关变量,并记录患者主要结局发生情况,包括:透析、肾移植及死亡,并进行结局分组。通过结合知识图谱表示学习,应用机器学习方法,建立基于病、证、症、风险因素等多个维度的知识、关系、路径向量的分类模型,对肾脏疾病的中医慢病管理临床获益预测实验进行分析。通过特征选择、参数调整等多种实验手段,对不同预测模型的性能分析验证及优化。区分度方面,利用接收者操作特征曲线下面积(Area Under the Receiver Operating Characteristic curve,AUROC),及F1系数评估不同模型的性能;一致性方面,使用Kappa值和Accuracy值进行判断。结果:本研究一共纳入256名慢性肾脏病4期患者,其中未发生终点事件组155人,发生终点事件组101人。通过Boruta算法共筛选出21个变量,包括:裂纹,舌胖大,齿印,降压药,服药种类,药物作用,肾毒药物,饮食不健康,优质蛋白,食物禁忌,盐分摄入,恶化停药,微信文字版,ALT/AST,ALB,Urea,TC02,Cr,体重分数,BMI及上臂肌围百分比。随后共采用8种机器学习模型进行训练,在区分度方面,稳定线性判别分析(Stabilized Linear Discriminant Analysis,SLDA)模型取得了最优的性能,AUROC为0.8;偏最小平方(Partial Least Squares,PLS)模型取得了次优的性能,AUROC为0.78;另外,K近邻(k-Nearest Neighbors,KNN)模型的性能不十分理想,AUR0C最低,为0.54;其余的模型AUROC没有显著性的差别。与AUC性能表现相似,对不同模型的F1系数进行分析,结果提示:SLDA仍然是性能表现最优异的模型,F1系数为0.84,次优的是仍然是PLS模型,F1系数为0.83,但没有显著性的差别。KNN模型的F1值为0.67,表现不十分理想。结论:基于计算机的机器学习算法,如利用SLDA及PLS模型,可以实时识别实践层面的干预效果,并且能更有针对性地纠正慢性疾病管理中的偏差。因此,机器学习方法为肾脏疾病的中医慢病管理提供了一种常规的策略管理方法,或许可以推广至其他慢性非传染性疾病的慢病管理中。