【摘 要】
:
随着科技的飞速发展,互联网技术的进步,计算机软件及硬件技术都得到了迅猛发展,在这样的时代背景下,人工智能和机器学习算法都得到了极大发展。图像分类一直是人工智能领域的基本问题,也是人脸识别,车牌识别和网络图像管理等其他高级视觉任务的基础。因此,鉴于图像分类问题在计算机视觉领域具有非常重要的地位,研究具有鲁棒性和准确性的图像分类算法具有重要的理论和实际意义。目前图像分类仍然存在着诸多问题,诸如非刚体物
论文部分内容阅读
随着科技的飞速发展,互联网技术的进步,计算机软件及硬件技术都得到了迅猛发展,在这样的时代背景下,人工智能和机器学习算法都得到了极大发展。图像分类一直是人工智能领域的基本问题,也是人脸识别,车牌识别和网络图像管理等其他高级视觉任务的基础。因此,鉴于图像分类问题在计算机视觉领域具有非常重要的地位,研究具有鲁棒性和准确性的图像分类算法具有重要的理论和实际意义。目前图像分类仍然存在着诸多问题,诸如非刚体物体的不规则变化、图像视角变化、尺度变化、光照变化以及被遮挡等,这些问题都会给图像分类带来了挑战。经过了几十年的发展,研究者已经开发了大量图像分类的算法,它们大致分为两大类:基于传统机器学习的图像分类算法,如基于词袋模型的图像分类方法,基于空间金字塔的图像分类方法以及基于图表示的图像分类方法等,这类方法有明确的理论解释和证明,且算法的复杂度相对较低,但是精度还有待提高。另一类为基于深度学习的图像分类算法,如卷积神经网络、残差网络等,这类方法的优点是通过深度网络提取图像特征,能胜任大规模的图像分类任务,缺点是模型需要大量的数据进行训练,且网络需要对大量的参数进行优化。本文针对小样本图像集的分类进行了研究,主要做出了以下贡献:(1)空间金字塔匹配方法已被广泛应用于场景识别和图像检索领域,它将图像分割成一系列子区域并分别统计子区域内的局部特征。但是,空间金字塔匹配方法并没有刻画图像局部特征的空间关系。为了在不同尺度下表征图像局部特征的空间关联性,本文构建包含词袋标签的图像多尺度属性图,计算任意两个图像区域对应属性图的距离,并且找到最优匹配。然后将不同尺度下属性图的距离进行池化,构建图像分类的核矩阵。在Caltech 101、Caltech 256、Scene Categories和Six Actions四个数据集上与五种方法进行了小样本训练集情况下的对比实验,实验结果证明了该方法在处理图像分类问题时的有效性。(2)给出了一种基于快速和精炼的多尺度属性图核的图像分类方法。首先利用PCA引导的K-means方法对图像特征进行聚类,构建词汇树并将其作为多尺度属性图的标签,然后将多尺度属性图中第0层的属性图进行精炼,得到精炼的属性图,然后针对第一层及以上的尺度,计算任意两个图像区域对应属性图的距离,并且找到最优匹配,并将不同尺度下属性图的距离进行池化,构建核矩阵。该方法优化了多尺度属性图核方法的计算复杂度,在四个公共数据集上对六种不同的图像分类算法进行对比实验,实验结果表明该方法在处理图像分类时的准确度和时间复杂度上取得了较好的效果。
其他文献
目的:对比极低出生体重儿撤机后使用经鼻间歇正压通气(nasal intermittent positive pressure ventilation,NIPPV)或经鼻双水平正压通气(biphasic positive airway pressure,
山羊传染性胸膜肺炎(Contagious Caprine Pleuropneumonia,CCPP)是由山羊支原体山羊肺炎亚种(Mycoplasma capricolum subsp.capripneumoniae,Mccp)引起的一类严重呼吸道疫病,
目的:通过研究NRP-1mAb对肝癌HepG2细胞株的生长抑制和促凋亡作用及其机制,并初步探究NRP-1mAb联合rhVEGI-192对肝癌HepG2裸鼠移植瘤的放射增敏作用及其机制,以明确这两种分
关键词抽取是从文本或文本集合中抽取描述主题性的词或短语。准确地抽取文本中的关键词可以快速总结文本内容,在许多自然语言处理任务中都有着至关重要的作用,如信息检索和支持决策等。当前大多数的关键词抽取方法不能针对每篇特定的文本进行抽取,通常都是抽取一个文本集合或者一个语料库中的关键词,而且不能灵活的捕获单词之间的语义关系。针对上述问题,本文提出两种新颖的从英文文本中抽取关键词的算法。一种是特定文本中强语
目前开关电源正朝着高频小型化趋势发展,原边反馈反激谐振变换器具有电路结构简单,开关损耗小等优点,非常适用于高频的中小功率AC-DC电源。由于该变换器利用寄生参数谐振实现
随着互联网和多媒体技术的不断发展,人们对视频清晰度的需求日益提高,大量高清及超清视频对计算机存储空间和传输带宽带来了巨大的冲击。为了应对视频急剧增长的数据量带来的
在当今的大数据时代下,半监督学习方法作为利用无标记数据进行学习的主流技术,在许多应用中发挥了重要的作用。然而,传统半监督学习方法的理论研究和实证分析大多是在随机缺
目的:通过全国多中心的问卷调查,为我国噬血细胞综合征[噬血性淋巴组织细胞增生症(hemophagocytic lymphohistiocytosis,HLH)]患儿进行血液净化治疗的指征提供依据。方法:中
随着工业化和城市化的快速发展,人们将重金属(HM)污染物(尤其是铅,汞,镉等)排放到土壤,水和空气中,已对生态系统造成严重威胁。有毒阳离子是最常见的HM形式,它们通过食物链在人类
作为世界四大粮食作物之一的马铃薯,块茎营养丰富,含有淀粉、糖类、蛋白质以及多种抗氧化剂,我国农业部更是在2015年启动了马铃薯主粮化的战略方针,凸显了马铃薯的重要地位。