论文部分内容阅读
图像分类算法属于机器学习的范畴,相较于数据挖掘与自然语言处理,图像算法的利用场景更加普遍。然而针对大体量的图像数据,实现一个复杂的分类模型仍需耗费极高的算力和时间成本。因此本文利用压缩感知的理论基础,提出了一种在保证模型分类准确率不变的情况下,计算速度大大增加的图像分类算法,并设计实现了从图像采集、预处理、压缩、训练至预测的图像分类系统,将其应用于步态识别项目和多分辨率图片分类任务,取得良好的成果。本文的研究工作如下所示:1)完成了对压缩感知的理论研究,阐述了其中信号稀疏性表达,感知矩阵的选取,图像重建的各类方法,并对其进行仿真,实现了图像的欠采样和重建;2)本文将压缩感知与图像分类相结合,提出了一种基于压缩感知的图像分类方法。由于图像分类不需要压缩感知完整地重建原图像,只要完成分类就可以,所以可以在压缩感知的压缩域下直接对压缩数据进行分类,由此大大减少了处理数据量。针对本算法的准确率问题,本文利用压缩感知中的约束等距性要求,推导出各图像在原空间与投影空间之间数据区分度的等距性。这意味着在压缩域中,不同样本之间的区分度不变,图像分类的准确率不会受到影响。另外,传统图片分类算法和本算法的对比仿真实验显示:两者的分类准确率相同,而后者所耗费的时间远小于前者;3)将基于压缩感知的图片分类算法应用于实际的人体步态识别系统,该系统致力于在走廊、办公室、监狱等环境中对行人步态进行采集,由系统自动判别此人身份。本算法大大减少了该系统数据更新与模型训练的时间,实现了实时判别。4)进一步的,利用该算法对图片维度的可控性,提出了基于压缩感知的多分辨率图片分类预处理方法,将其与传统的图片降维方法进行比较,前者在多分辨率图片分类模型中的准确率远高于传统方法。