论文部分内容阅读
近年来,随着智能接口和人机交互技术的迫切需求和快速发展,以人脸表情识别为主的情感计算成为新的研究热点。人脸表情识别能够增强人机交互的智能性和友好性,具有重要的科研价值和应用价值。另外,随着数码照相机、摄像机的广泛使用和多媒体共享网络(如YouTube)的快速发展,网络视频的数量正呈海量增长,如何从观察者的情感角度高效准确的对这些视频进行分类与推荐对于网站管理和增强用户体验变得至关重要。本文在总结国内外人脸表情识别及视频分类与推荐研究现状的基础上,分析了现有研究存在的问题与缺陷,提出了一种基于空间特征和隐动态条件随机场的表情识别方法,并且以此为基础,从观察者表情识别的情感角度对视频进行分类与推荐,取得了良好的效果。具体的研究工作如下:首先,对表情图像进行预处理,本文提出了一种基于人脸检测的眼睛定位算法,以定理的形式给出了图像旋转前后坐标的对应关系并进行了证明。在检测到人脸之后,采用形态学滤波与求区域中心相结合的方法对眼睛进行精确定位。接着对表情图像进行尺度归一化和灰度归一化操作,为后续操作奠定了基础。其次,本文提出了一种基于空间特征和隐动态条件随机场的表情识别方法。首先把构造组合Haar特征的过程嵌入到改进的AdaBoost算法中,提取出表情的空间特征。然后提出了一种新的图模型—隐动态条件随机场,它结合了隐条件随机场和动态条件随机场的优点。采用最大似然估计的方法对其参数进行估计,并且把它与已有的概率模型进行了比较。接着通过把空间特征嵌入到隐动态条件随机场中,即把时间特征和空间特征结合起来,对人脸表情进行识别,在Cohn-Kanade数据库上的实验证明了算法的有效性和准确性。最后,根据提出的表情识别方法,对观察者观看视频的表情进行识别,构造出他们的情感曲线,根据已有的心理学及电影学研究基础,对视频进行分类与推荐。通过表情的变化次数及规律,给出了视频类别及推荐分数。在我们收集的数据库上进行实验,效果良好,绝大多数观察者对视频类别及推荐分数的结果是满意的。文章最后总结了本文的主要工作和存在的不足,并且对该领域未来的发展趋势进行了展望。