论文部分内容阅读
高血压是常见的病种,对高血压的治疗是全球重大的公共卫生问题之一。目前在临床高血压治疗中,大都以口服药的形式给予治疗,目的在于控制血压。但由于每位患者的高血压病因不同,症状不同,同时各类药物组合非常复杂,各种因素综合起来,使得临床医生很难对每一位患者都给出最佳药物治疗方案。因此本课题通过数据挖掘技术,来分析各个高血压的给药治疗方案,挖掘出影响每个治疗方案是否成功的关键因素。用这些关键因素为评判标准指导临床医生对患者开药,以达到减轻患者痛苦,提高医疗质量,节约有限卫生资源的目的。本课题建立了两个模型来进行数据挖掘。其中一个模型是药物因素分析模型,目的在于找到影响每个治疗方案是否成功的关键因素。此模型从统计可视化角度和机器学习算法角度,可分别得到一个特征选择结果,再把两个特征选择结果进行组合得到一个更完善的结果。最终每一个药物方案都可以获得一个完善的特征选择结果,即影响每个治疗方案是否成功的关键因素。第二个模型是药物预测模型,采用机器学习的五个预测算法来为各组药物进行建模,最终选择正确率最高的模型,由模型为患者来选择合理的用药方案,为医生提供辅助诊断。在药物因素分析模型中,我们对统计可视化角度和机器学习算法角度所获得结果进行了比对,发现大部分药物的吻和度高达百分之80左右,即统计可视化和机器学习算法都认为这些因素是重要的。通过临床医生对这些结果的解释与分析,得到了对高血压药物选择有实际意义的决策信息。在药物预测模型中,我们比对了各个预测模型,发现其中正确率最高的模型为随机森林(75%),第二为梯度提升树(72.5%)。在本数据集上,从实际效果来看,集成学习算法是优于普通算法的。本课题为高血压给药方案选择提供了一个全新的思路,该方法进一步完善后,可以推广至其他慢性疾病的给药选择。