论文部分内容阅读
抑郁症作为一种精神疾病,会对患者、患者家人及社会造成严重影响。在抑郁症诊断中,医生利用量表对患者提问,通过分析患者回答的内容、行为表现等进行诊断。本文针对抑郁症诊断中具有重要意义的表情识别开展研究,为了模仿医生诊断过程建立智能化诊断方案,进一步建立了抑郁症智能诊断标注系统。本文的主要工作如下:(1)建立基于协方差池化和注意力机制的表情识别模型VBLCA。针对CNN-RNN表情识别算法无法很好提取二阶特征与较长时序信息的问题,利用协方差池化实现脸部二阶变化特征的提取,同时利用自注意力机制,实现对时序有效信息的更好捕捉,从而有效提高识别准确率。VBLCA在七分类的AFEW验证集达到51.05%的准确率,相比最新单模型算法提升了2.05%。此外,流泪作为表情程度较深的一种体现,对抑郁症诊断非常重要,本文通过网络搜索和多人标注的方法自建立了流泪数据集,VBLCA在二分类的流泪数据集达到92.04%的准确率。(2)建立基于时间转移模块和注意力机制的表情识别模型RNTA并进行模型融合研究。针对3DCNN表情识别算法参数量巨大,计算复杂的问题,利用时间转移模块实现不增加2DCNN计算量的情况下提取时空特征,同时在分类过程中,利用注意力机制融合多帧的结果,从而提高识别准确率。RNTA在AFEW验证集达到54.47%的准确率,相比最新单模型算法提升了5.47%,在流泪数据集达到93.83%的准确率。为了进一步提高模型的性能,设计了分数平均融合、全连接层融合、基于attention的特征层融合三种模型融合方案。在AFEW验证集上,分别达到56.05%、50.79%、51.57%的准确率,在流泪数据集上,分别达到95.26%、93.05%、93.55%的准确率。实验结果表明,分数平均融合可以进一步提高表情识别的准确率。(3)实现抑郁症智能诊断标注系统。本文综合《蒙哥马利抑郁评定量表》、《汉密尔顿抑郁量表》和专家意见确立抑郁症诊断实体及属性值。该系统能够利用数据采集模块收集信息,利用量表作答模块获取患者近况,利用表情识别等算法及标注模块标注实体属性值,并展示最终的诊断结果。经测试该系统达到设定目标,已投入使用。本文针对表情识别提出的改进算法对准确率有一定提高,针对抑郁症智能化诊断提出的系统综合考虑了多方面因素,均具有较高的应用价值。