论文部分内容阅读
随着互联网技术的迅猛发展,人和网络之间的交互性越来越强,在信息交互中多媒体技术得到广泛应用。但多媒体信息内容广泛多样,健康信息与不良信息混合其中。不良信息传播影响着人民的正常生活、社会秩序的稳定,由此内容安全技术正逐步发展成为一个重要研究领域。 图像是多媒体信息的基础,图像内容审计是内容安全的一个重要研究方向,图像分类作为图像内容审计的关键技术,可以有效的对图像信息进行组织和管理。图像内容信息具有不同的主题意义,在分类中,被称为多标签图像和单标签图像,多标签分类研究尚处于起步阶段。网络图像信息同时又具有丰富性,更新速度快,且训练信息规模大的特点,为了减少标记开销和维持分类准确率,关于分类器学习方法的研究成为了热点。 在内容安全的背景下,本文以图像为研究内容展开,取得的成果有如下三个方面: 1、多标签分类方法研究。提出了基于球结构支持向量机的多标签分类方法,为每个标签对应的样本集合构建球结构支持向量机,依据多标签球结构支持向量机特性,从重叠区域度量样本的多个主题特性。减少了多类分类方式所需构建分类器的开销,具有良好的可拓展性。 2、减少训练样本标记工作开销的研究。在多标签分类中,针对球结构支持向量机提出了主动学习策略。以分类后的信息缺少样本作为最有价值样本,以邻域策略选择待更新分类器。此方法可以通过较少的样本标记工作获得较好的分类性能。 3、分类训练开销和分类器性能稳定性的研究。将主动学习方法和增量学习方法协调运用到球结构支持向量机中,在单标签分类领域,以边界近邻方法选择最有价值样本,通过阶段更新策略对分类器更新,并控制内存中支持向量的数目。保证了分类器的训练效率和稳定性能。 图像分类技术在网络信息审计中可以对不同主题信息给出合理标注,依据具体情况作出分类处理。主动学习和增量学习思想在机器学习方法中的应用可以提高计算机对信息的智能处理能力,因此本文研究具有一定的理论价值和实用价值。