论文部分内容阅读
情感是指人类对外部客观事物的探索和认知过程中产生的态度体验与行为反应,在个体的学习探索、逻辑推理、分析决策和计划创造等方面发挥着重大作用。情感识别是通过采集含有情感信息的人体行为特征或生理信号,从中挖掘提取具有表征情感状态差异性的特征,进而构建具有高度可分性和泛化能力的情感模型的过程。准确、快速并具有预测性地识别情感,在临床医学、社会科学和工程实践中具有重要的理论意义和应用价值。 基于脉搏信号的分析方法成熟,采集途径多样,具有便携、无创、连续、客观、可靠等优点,本文设计并实施了情感激发实验,采集了六种情感状态下的脉搏信号,利用统计分析、信息论、数据挖掘和机器学习技术,分析、量化、评估、筛选其情感信息成分,建立脉搏信号的高纬情感特征矩阵,并基于最优化机器学习算法明确了矩阵与情感状态之间的映射关系,设计并搭建了具有良好识别性能的情感状态分类器,实现了多种情感状态的识别。本文的主要研究内容如下: (1)通过设计情感激发实验方案,搭建实验实施环境,采集了六种情感状态下60名普通大学生的脉搏信号数据。通过脉搏信号的降噪处理以及信号、特征点、时间序列、特征的逐层映射,在线性和非线性空间内提取252个具有一定物理意义的特征,构建特征矩阵描述脉搏信号的变化规律,实现了情感状态下脉搏形态特征的定量化。 (2)基于统计检验技术明确了特征序列与情感状态的正态性、方差齐性和独立性,利用非参数分析方法探究不同情感状态下,特征分布规律的差异性以及特征序列与情感状态间的相关性,明确了脉搏信号特征矩阵的情感属性。 (3)采用归一化的互信息方法量化特征序列之间,以及特征与情感状态之间的相关程度和特征矩阵的冗余信息量。基于此,利用最小冗余最大相关算法、随机森林算法和统计检验技术,在特征空间内进行搜索,构建具有最大情感分辨能力和最小信息冗余的特征矩阵,并量化了特征对情感识别的贡献值。 (4)综合统计分析技术、信息论、机器学习算法和统计检验方法,构建三级特征评估与筛选体系,实现了对特征序列的分析、挖掘、评估和赋权,进而筛选出低维度、高分辨力的特征,构建最优特征矩阵。 (5)设计并搭建基于随机抽样、十折交叉检验和网格寻优算法的情感识别模型的学习框架、建立基于最优特征子集和最优参数的情感识别模型,实现情感状态是有效识别,并对不同学习模型的识别性能进行了比较评估。 (6)建立基于最优特征子集、最优参数和随机森林算法的多情感状态识别模型,设计模型性能和训练样本量占比比关系的研究策略,搭建研究框架,明确模型识别性能与分割比例间的定量关系,确定模型最小训练集。 脉搏信号包含情感信息,情感状态的改变会引起脉搏信号形态的变化,本文提取的特征可以定量的表征这些变化规律;基于情感特征矩阵的分析表明,时间序列线性特征的分辨能力要显著高于非线性特征,由情感因素造成的脉搏信号形态上的变化主要体现在频域上的能量变化;本文构建的三级特征评估与筛选体系,有效地降低了情感特征的维度和模型复杂度,提高了模型的运算效率和泛化能力;基于最优特征子集和最优参数建立的情感分类模型,具有较高的情感分类准确度以及较强的鲁棒性,并在保证分类精度的前提下实现了模型训练集的最小化。