论文部分内容阅读
心脏是人体的重要器官,对身体健康有着至关重要的作用。心脏病是内科疾病中的常见病症,近年来先天性心脏病高发趋势尤为明显,因此对于青少年心脏病的关注度也越来越高。在临床上,心音检查是心脏疾病诊断的主要方式。医生通过听诊器去获取患者的心跳状况,然后根据自己的临床经验做出诊断。由于不同级别的医疗机构中医生的临床诊断经验可能存在差异,听诊结果会影响到患者疾病的临床诊断,导致治疗的延误。
为了解决在心音检测中医生临床经验的差异性,本文基于上海某三甲医院的青少年心音临床检查数据,利用数据挖掘分析和机器学习算法,从数据中学习三甲医院医生的临床经验,提出了基于小波分析和随机森林分类器的青少年心音分类方法,设计并实现了青少年心音检查临床辅助诊疗系统。该系统可以辅助医生进行青少年心音的临床诊疗,从而提高诊疗准确性。本文的主要工作有以下三个方面:
1)提出了一种基于小波分析和随机森林的青少年心音分类方法
通过分析上海某三甲医院采集来的青少年心音数据,针对青少年心音数据第三心音较为高发的特点,提出了一种基于小波分析和随机森林分类器的青少年心音分类方法。首先通过小波分析完成对临床心音信号的噪声去除和异常采集检测等预处理;然后采用传统心音分割方法对第一心音(S1)、收缩期、第二心音(S2)和舒张期等四部分进行分割,同时本文特别针对青少年心音的特点,利用希尔伯特-黄变换算法还加入了对第三心音(S3)的分割;最后将这五部分的心音分割信号的时域和频域特征作为输入特征,构建了基于随机森林方法的青少年心音检测分类模型。实验结果表明该方法的准确度可以达到87.5%,相比传统心音分割方法仅提取S1、收缩期、S2和舒张期等四部分进行分类的准确度提升了3.1%。
2)青少年心音分类模型的可解释性分析
首先对心音特征重要性进行了分析,利用模型可解释性分析方法,研究了心音信号随机森林分类模型中各个特征对于模型预测结果的权重影响,从临床角度对其中权重较高的特征做出了分析;然后对心音信号特征有效性进行了分析,利用模型无关的可解释分析方法,研究了心音信号的单个特征值变化在整体和局部上对模型的影响,从而去除了无效特征值;最后对心音分类模型的特征参数进行了优化,在心音特征重要性分析和基于模型无关可解释方法的特征有效性分析基础上,去除了权重较低和无效的特征,实验表明将新的特征组合输入模型重新训练,在几乎相同的训练结果下,模型的训练效率提高了60%。
3)设计并实现了青少年心音检查临床辅助诊疗系统
该系统主要为医生对青少年心音临床检查提供辅助诊疗决策,主要分为管理员端和医生端两部分。医生可以上传患者的心音临床听诊数据,然后调用系统中的心音分类模型进行预测,最终参考模型的预测结果,并结合医生的临床经验给出患者的诊断报告;管理员负责模型训练与管理、系统用户管理以及功能模块维护等操作。
为了解决在心音检测中医生临床经验的差异性,本文基于上海某三甲医院的青少年心音临床检查数据,利用数据挖掘分析和机器学习算法,从数据中学习三甲医院医生的临床经验,提出了基于小波分析和随机森林分类器的青少年心音分类方法,设计并实现了青少年心音检查临床辅助诊疗系统。该系统可以辅助医生进行青少年心音的临床诊疗,从而提高诊疗准确性。本文的主要工作有以下三个方面:
1)提出了一种基于小波分析和随机森林的青少年心音分类方法
通过分析上海某三甲医院采集来的青少年心音数据,针对青少年心音数据第三心音较为高发的特点,提出了一种基于小波分析和随机森林分类器的青少年心音分类方法。首先通过小波分析完成对临床心音信号的噪声去除和异常采集检测等预处理;然后采用传统心音分割方法对第一心音(S1)、收缩期、第二心音(S2)和舒张期等四部分进行分割,同时本文特别针对青少年心音的特点,利用希尔伯特-黄变换算法还加入了对第三心音(S3)的分割;最后将这五部分的心音分割信号的时域和频域特征作为输入特征,构建了基于随机森林方法的青少年心音检测分类模型。实验结果表明该方法的准确度可以达到87.5%,相比传统心音分割方法仅提取S1、收缩期、S2和舒张期等四部分进行分类的准确度提升了3.1%。
2)青少年心音分类模型的可解释性分析
首先对心音特征重要性进行了分析,利用模型可解释性分析方法,研究了心音信号随机森林分类模型中各个特征对于模型预测结果的权重影响,从临床角度对其中权重较高的特征做出了分析;然后对心音信号特征有效性进行了分析,利用模型无关的可解释分析方法,研究了心音信号的单个特征值变化在整体和局部上对模型的影响,从而去除了无效特征值;最后对心音分类模型的特征参数进行了优化,在心音特征重要性分析和基于模型无关可解释方法的特征有效性分析基础上,去除了权重较低和无效的特征,实验表明将新的特征组合输入模型重新训练,在几乎相同的训练结果下,模型的训练效率提高了60%。
3)设计并实现了青少年心音检查临床辅助诊疗系统
该系统主要为医生对青少年心音临床检查提供辅助诊疗决策,主要分为管理员端和医生端两部分。医生可以上传患者的心音临床听诊数据,然后调用系统中的心音分类模型进行预测,最终参考模型的预测结果,并结合医生的临床经验给出患者的诊断报告;管理员负责模型训练与管理、系统用户管理以及功能模块维护等操作。