论文部分内容阅读
随着科技的发展,图像在社会治安、军事安全、信息安全、身份认证、交通监管等方面都有着广泛的应用。而图像识别技术则是图像应用的关键技术之一,受到了广泛的关注。尤其近年来机器学习算法在图像识别领域中的应用,为图像的分类、识别及特征提取等提供了新的技术手段,成为了该领域的研究热点。本论文针对实际工程中应用机器学习算法处理图像时,因存在实际训练样本不足导致机器学习效果不理想的问题,从研究图像特征提取原理入手,研究虚拟样本的生成算法、虚拟样本的数量等对机器学习性能的影响。论文首先对典型的两种机器学习算法(支持向量机和深度置信网络)进行了工作原理分析和介绍;同时通过实验验证了常用的图像特征提取与降维机理、作用。其次,本文研究了一种基于特征层面对虚拟样本有效性进行评价的基本思路,即利用特征评价中的“互信息”、“欧氏距离”以及最后的总体识别精度作为对构建虚拟样本有效性的评价;并对基于“重采样”、“奇异值重构”、“轮廓波重构”三种方法生成的虚拟样本有效性进行了实验验证和有效性评价,实验结果表明论文使用的三种虚拟样本生成算法能够实现对原始样本有效扩充,并改善识别效果。最后将论文的研究成果应用于SAR图像及人脸图像的识别中并通过在支持向量机与深度置信网络两种机器学习算法分别实验验证。人脸方面在ORL、YALE与FERET多个数据集上的实验表明,在样本数不足时通过拓展虚拟样本可以有效地提升人脸图像的识别率。另外在SAR图像的MSTAR公共数据集上使用本文使用的虚拟样本方法扩充后能够明显提高识别分类效果,拥有更加优秀的识别性能。本文的结论证实了虚拟样本在机器学习算法上的有效性以及广泛应用空间,也为机器学习中解决小样本问题提供了有力的帮助。