论文部分内容阅读
癫痫是一种常见的神经科疾病,脑部神经异常放电是癫痫发作的主要原因。癫痫的危害性极大,它的发作是随机发生的,可以在一天内多次发生,发作时常表现为意识丧失、浑身抽搐、精神异常等。在无人看管情况下的癫痫患者可能因各种因素而突然意外死亡,包括咬伤舌头,分泌物或呕吐物堵塞呼吸道,引起窒息,不受控制的全身强直、痉挛等。癫痫的发病率较高,且年龄段分布极广,包括儿童、青少年和老人,但以儿童和青少年的发病率最高。这种疾病男女都有可能罹患,且男性患病概率高于女性。脑电图是癫痫研究过程中一个非常重要的工具,它提供了其他生理学方法无法提供的信息。癫痫发作时产生的特异性波形如棘波、尖波、复合波等都可以通过脑电图体现出来。由于脑电信号的采集往往是多个部位同时进行的,因此产生的脑电图为多通道EEG。本文旨在时频域中提取合适的特征以解决多通道数据关联问题,并运用集成学习方法,基于融合后的特征进行癫痫发病的预测。本文在总结了国内外癫痫脑电自动识别方法的基础上,首先阐述了具有集成学习思想的几种方法:Bagging、Boosting和Stacking。之后分析了现有的脑电特征提取方法,在此基础上结合患者的脑电图时域和频域分析的结果,利用时频域中的相关系数矩阵及其特征值解决了多通道之间的关联问题,并与频域中的振幅和相位特征进行融合。然后使用随机森林模型对比不同的频率段和不同特征的预测效果,确定了后续建模使用的频段和特征,接着分别用基于Bagging的随机森林和基于Boosting的梯度提升树以及XGBoost建立癫痫脑电自动识别模型。最后,使用Stacking方法集成三种模型,成功减小了由于个体差异所产生的预测误差,提升了模型的效果。本文的研究结果表明,融合了多通道EEG频域中的振幅、相位以及时频域相关系数矩阵及其特征值后的特征可以有效提升预测效果;基于树模型的方法对癫痫检测都有较好的预测效果,三种模型的AUC都达到了87%以上,但由于个体差异,三种模型在部分测试集上效果欠佳;Stacking集成方法的AUC达到了92%,可以有效地减小由于个体间的差异所带来的误差。因此,本文的研究可以有效帮助识别癫痫的发作,一方面可以大大降低预测的成本;另一方面能够减少医生的工作量,帮助医生提高诊断效率,同时减少误诊的可能,从而可以使患者得到及时有效的治疗,减轻医生和患者的负担。