论文部分内容阅读
时间序列分析是统计分析学的中心主题,也是表征生物学、医学和经济学数据以及发现其潜在动力起源的有力方法。生理信号序列挖掘是时间序列分析的一个重要应用领域,生理信号能够反映人体各项机能,包括情绪、疲劳和健康状况等。常见的生理信号包括心电图(Electrocatdiogram,ECG)、脑电图(Electroencephalogram,EEG)、呼吸节律、肌电图(Electromyography,EMG)、皮肤电反应(Galvanic Skin Response,GSR)和血压等。因此,获取并挖掘多种生理信号,对计算机辅助诊断人类疾病具有重要意义。目前,利用生理信号展开疾病诊断预测主要面临三个挑战:第一,信号噪声干扰与随机性强问题。生理信号是由人体自然产生的,随机性强且一般是非平稳信号,记录时又会受到人体、仪器或周围环境的干扰。因此,寻找有效的方法降低噪声的干扰并提取有效特征一直是研究的热点。第二,多通道信号的综合挖掘以及患者信号之间的相关关系挖掘问题。现有的研究大多侧重于独立分析单个通道的数据,并未利用患者信号之间隐含的关联关系。研究发现,虽然每个患者的生理信号均不同,但是同一疾病患者的生理信号之间存在一定的相似性。如何利用这种相似性得到更好的预测结果也是非常值得研究的问题。第三,信号通道之间的空间位置连接不等同于它们之间的功能连接。即紧密的空间关系不能保证紧密的功能关系,而功能关系对于判别性的生理信号特征提取非常重要。因此,需要动态地构建信号通道之间的功能关系,以往的方法根据通道的空间位置预先确定通道之间的功能关系是不合理的。针对上述问题,本论文以ECG和EEG为切入点,开展了面向生理信号序列的动态图挖掘方法研究,并对人体生理疾病进行了检测。论文的主要创新成果如下:(1)提出了基于加权多尺度有限穿越可视图的单通道信号序列挖掘方法,以解决信号噪声干扰与随机性强问题。论文提出并设计了加权多尺度有限穿越可视图(Weighted Multi-Scale Limited Penetrable Visibility Graph,WMS-LPVG)模型,根据不同的心电信号序列动态地构建WMS-LPVG,处理了单通道心电信号,并对房颤疾病进行检测。首先,对心电信号进行加权粗粒化;其次,用WMS-LPVG方法将粗粒化后的序列动态地转化为复杂网络,减少了噪声的干扰;再次,提出新的网络特征—局部效率熵,并与其它复杂网络特征和原始的心电信号特征融合形成多模态特征,得到了更加有效的特征表示;最后输入极端梯度增强(e Xtreme Gradient Boosting,XGboost)分类器以检测房颤疾病。(2)提出了基于图互信息最大化的多通道信号序列挖掘方法,以解决综合处理多通道信号以及患者信号之间的相互关系问题。在上述成果基础上,论文研究了多通道脑电信号,引入了患者信号之间的相互关系,结合图互信息最大化和预训练图卷积神经网络(Graph Convolutional Neural Network,GCN),提出GCNs-MI模型,对抑郁患者进行检测。首先,将每个样本的多通道脑电信号按顺序拼接成一个长信号序列,作为网络节点,并计算拼接后的信号之间的皮尔逊相关系数(Pearson Correlation Coefficient,PCC),组成图网络。其次,将每个通道的信号分为六个频段,计算每个频段的平均功率,并将它们按顺序拼接在一起作为节点特征。再次,我们预训练了一个三层GCN模型,固定GCN的前两层,并使用图互信息最大化的对比学习方法微调模型的输出层(第三层)。(3)提出了基于动态图卷积神经网络的信号通道之间关系挖掘方法,以得到更强的信号特征表示,进一步挖掘生理信号通道之间的内在关系。基于上述成果,论文设计了动态图卷积神经网络(Dynamic Graph Convolutional Neural Network,D-GCN)模型,将每个通道作为脑网络的节点,以动态方式学习邻接矩阵来构建脑网络中各个节点之间的连接,即邻接矩阵中的数据在模型训练过程中随着模型参数的变化而自适应地更新。与GCN方法相比,D-GCN学习的邻接矩阵将更加有效,它捕获了信号通道之间动态的内在关系,能够提高疾病的识别效果。本论文主要研究了ECG和EEG两种生理信号,在2017年心脏病学挑战赛中用于房颤分类的短单导联心电图记录数据集和IEEE Healthcom 2020/MODMA用于抑郁障碍分析的全导静息态脑电图记录数据集上进行了广泛实验,并利用多项指标综合的评价模型性能。实验结果证明,与目前最新成果相比,本论文提出的一系列动态图挖掘方法具有更好的效果。