论文部分内容阅读
随着计算机存储、运算技术的飞速发展以及人类收集和存储数据能力的不断增强,机器学习已经成为计算机科学技术中最受关注的领域之一。有监督学习(例如分类、回归)、无监督学习(例如聚类)等是机器学习领域常用的两种方法。然而训练样本数目很少时有监督学习难以准确学习出样本的真实分布,不需要训练样本的无监督学习对于空间分布较复杂的数据难以得到好的学习效果。因此,结合两种传统学习方法的半监督学习利用大量未标记样本辅助有限的有标记样本提高了学习的准确性。基于图的半监督学习是半监督学习中的一个研究热点。近年来,稀疏表示开始应用于半监督图的构造中,它将连接关系的确立和连接权值的计算一步确立,得到了很多学者的关注。低秩表示是最新提出的能够挖掘数据结构特性的联合稀疏表示模型。本文将低秩表示引入到图矩阵的构造中,提出了几种基于图的半监督学习算法,具体研究内容如下:(1)提出了一种基于核低秩表示图(KLRG)的半监督学习算法。在该算法中,先通过核函数将样本集合映射至特征空间,再对映射后的样本集进行低秩表示得到低秩编码系数矩阵,从而构造图进行半监督分类。由于核映射加强了数据的可分性,低秩表示给解进行了全局的约束,核低秩表示能够自然的反映出数据的全局结构性,从缺损数据中实现更加鲁棒的子空间分割。在UCI数据集、人脸数据库等和其他一些Benchmark数据集上进行仿真实验,实验结果表明:该算法与同类算法相比,分类正确率有所提高。(2)提出一种基于KLRG和成对约束的半监督学习算法。在谱聚类中已证明加入成对约束有较好的性能,本文根据少量标记信息和距离信息构造成对约束矩阵,将其和核低秩表示矩阵进行点积,构造新的图进行划分。在常用的标准人脸数据库和手写体数字数据库上进行的仿真实验验证了该算法的有效性,并用于纹理图像的分割。(3)提出了一种基于KLRG和空间约束的高光谱地物分类算法。在KLRG方法的基础上,对高光谱图像的类标进行光滑性假设,通过空间约束的思想,构造空间约束图,将空间位置的信息加入到KLRG图中。由于获得的图矩阵增强了标记的平滑性,减少了奇异点的出现,因此在后续分类中可获得更高的分类正确率。在高光谱数据上进行实验仿真,结果显示:与同类算法相比,分类正确率有所提高。本文的工作得到了973国家重点基础研究发展计划(2013CB329402,NCET-10-0668),国家自然科学基金(61072108,60971112,61173090),教育部博士点基金(20120203110005),武器装备预研基金项目(9140A24070412DZ0101),高等学校学科创新引智计划(111计划):No. B0704的资助。