论文部分内容阅读
手指语是聋哑人之间正常交流沟通的语言,是同自然语言并存的语言,其目的是实现聋哑人与正常人、聋哑人之间的便捷、快速、有效的交流。随着计算机视觉技术的不断发展,基于人机交互的智能手指语识别系统日益成为研究热点。稀疏编码通过对原始信号的稀疏表达可有效降低数据处理维度、提高处理速度,是当前大数据背景下计算机视觉应用领域的热门方法。因此,本文以稀疏编码方法为基础,从图像采集、预处理、特征提取和分类四方面对手指语识别进行了深入研究。首先,利用高清相机采集了24类手指语,每类采集100个样本,共2400个手指语样本;然后,对这些图像进行预处理,预处理包含阈值分割和边缘提取两部分,通过对不同算法的比较,选取实时性强的阈值分割方法对图像进行分割,选取提取图像边缘清晰流畅的Sobel算子对图像进行边缘提取;之后,在特征提取部分,本文分别应用HOG、SIFT、LBP方法以及Gabor方法对每一类手指语的每个样本进行特征信息的提取并进行比较,发现HOG特征提取方法对图像几何具有良好的不变性,特征提取准确,因此选用HOG方法对图像进行特征提取;最后的识别分类阶段,将提取出的样本数据的特征信息映射到稀疏空间,并采用LC-KSVD(Label Consist K-SVD)算法经过字典学习得到过完备字典,对每一类手指语进行稀疏表示,再将判别错误项的判别性稀疏编码与重构误差、分类性误差组合成目标函数,进而实现对手指语类别的有效区分。为验证本文方法的有效性,在自行采集的24类手指语数据集上进行了测试,在不同字典尺寸和不同稀疏因子的选取下,将本文方法与稀疏表示分类、D-KSVD(Discrimination K-SVD)、分类回归树算法以及K最近邻分类算法进行了识别率以及识别时间的对比。实验结果表明本文方法对区分不同的手指语分类效果较好,识别率达到99.5%,且实时性较强。