论文部分内容阅读
摘要人脸是人类个体最具有代表性的特征之一,它对于表征图像/视频的内容有重要作用。尽管人脸彼此有差异,但它们具有共同的特征,如何描述并利用这些特征是人脸检测技术的关键问题。在传统的空间像素域人们已经提出了很多方法来检测人脸,但是图像/视频数据大多以压缩形式存储和传输,研究压缩域的人脸检测技术具有重要意义。而本文正是从这点出发,研究如何在压缩码流上提取人脸特征,实现压缩域的人脸检测。本文提出了一种用于 DCT 压缩域的基于多模高斯模型,并结合神经网络分类器以及肤色验证的人脸检测方法。该方法利用多模高斯模型近似人脸模式在特征空间中的分布,采用修正的 K 均值聚类算法,对人脸样本进行聚类,得到若干个人脸原型的聚类中心。同时利用非人脸样本的聚类结果细化人脸模式分布的边界,辅助描述人脸模式在特征空间中的分布,最终得到人脸模式的基于统计分布的模型。基于该人脸模型,设计一定的判别准则,利用 BP 神经网络作为分类器,实现模式的判别。另外,对于彩色图像的压缩域人脸检测,充分利用人脸的肤色信息,设计了肤色验证模块。本文对 DCT 压缩域中的相关问题进行了较为深入的讨论,其中包括:压缩标准中分块操作所导致的分块效应问题,推导了利用基变换的 DCT 系数合并算法,以及 DCT 域中图像的分数缩放技术。在压缩域中进行人脸检测是一项新工作,它有着广泛的应用前景,本文对该问题进行了初步的研究,并取得了一些结果。在 DCT 压缩域中进行传统的模式检测工作,在多媒体内容分析方面,这是个有前途的研究方向。