基于深度学习的国画图像分类算法研究

来源 :西安邮电大学 | 被引量 : 0次 | 上传用户:gtghs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国家的繁荣发展,人民的生活水平明显提高,注重物质生活的同时也开始培养内心的精神世界。国画作为我国传统文化的瑰宝之一,受到越来越多人的品鉴与收藏。因此,国画数字化的趋势越发强烈,有关国画数字艺术馆的管理需求使中国画图像的分类与识别技术成为了亟待解决问题中的关键。经分析发现,国画处理技术面临两个困难,其一是由于国画图像存在“语义鸿沟”,仅提取全局底层特征很难达到良好的分类效果,因此需要获得显著、有用的特征作为分类依据;其二是中国画家在绘画时多以主观意境为主,同一对象不同作者所塑造出的风格大相径庭,因此在基于内容的国画分类上有一定的难度。文章内容主要探索基于深度学习的中国画图像语义分类算法,主要工作如下。1、为了同时捕获国画图像整体风格特征和局部笔触特点而提高分类精度,提出了一种基于卷积神经网络(Convolutional neural network,CNN)与长短时记忆(Long short memory,LSTM)网络相结合的并行混合模型,以实现国画图像分类。首先,设计了一个CNN网络用于得到国画图像的整体风格特征,然后对国画图像进行分块,且设计了一个LSTM网络对这些区域进行处理,从而获取区域间的依赖关系而得到笔触特征。最后,设计了一个特征融合策略,即在所提混合模型中设计了一个自适应加权融合层,通过可学习的方法对上述两类特征进行自适应加权融合,作为国画图像的最终特征表示,送入Softmax分类层实现分类。为了验证所提模型的有效性,在自建的国画数据集(Chinese painting,CP)上进行对比实验,实验结果表明所提模型可达到96%的分类精度,且优于其他算法。2、为了解决国画图像的弱监督问题,提出了一种基于LSTM的多示例学习(Multi-instance learning,MIL)的算法,以实现国画图像分类。为了在MIL框架下实现国画图像分类,首先,设计了一个多示例建模方案,即利用金字塔重叠网格划分方法对国画图像进行分块,从而将其转换为多示例包。然后,设计了一个序列生成器,即利用多示例学习的性质定义了一个“特有性”准则函数,用它从正包中选择一些具有判别能力的示例而构造成一个判别示例集,以将多示例包转换成等长且有序的信号序列。第三,设计了一个具有注意力机制的多层LSTM网络模型,将生成信号序列输入该模型,对其进行语义分析,以获得其记忆编码特征而作为对应国画图像的最终特征表示。最后,利用模型中的Softmax分类层,实现对国画图像的进行分类预测。工作中的创新点有:该算法将注意力机制引入到多层LSTM网络模型中,即通过计算网络当前层输入序列与输出向量的匹配程度,为较高层的LSTM输入分配不同的权重,以充分挖掘不同示例对国画分类的影响程度;针对国画图像分类的基本需求,在深入了解国画图像分类特点的基础上,将LSTM引入到多示例学习方法中,与其他基于包嵌入的MIL算法相比,LSTM更能捕获示例之间的相互依赖关系。对比实验结果表明,将LSTM网络引入MIL是可行的,所提出的MIL算法在国画图像分类中性能也优于其他分类算法。
其他文献
随着大数据时代的来临,需要分析处理的数据程指数型增长。降维技术作为数据挖掘预处理技术的重要组成部分,它能有效地减少学习算法的计算复杂度,从而使得传统的学习算法处理大规模数据成为可能。而特征选择作为降维技术的一种,因为其降维后的数据具有可读性高以及不改变数据结构的特点,被广泛应用于各个领域。该方法的步骤主要分为两个部分,生成特征聚类结果和聚类后的特征选择。但是在基于聚类的特征选择算法中依旧存在以下四
随着计算机技术的飞速发展以及人们对智能化设备需求的提高,人体行为识别已经成为计算机视觉领域热门研究方向之一,其广泛应用于公共安防、人机交互、虚拟现实、体育运动和医疗健康等领域,具有极高的理论研究价值。早期的研究工作主要针对于RGB视频图像,由于易受复杂背景、光照强度的影响,很难达到理想效果。但随着深度传感器技术的发展,高精度获取三维骨架关节点信息变得方便可行。对比传统RGB视频图像数据,骨架姿势信
第五代移动通信系统的迅速发展为构建天空、海洋、陆地一体的战略网络蓝图带来了契机与动力,将具备高速率、低延时、大容量等特点的5G技术与卫星移动通信的融合已成为大势所趋。`星座组网中低轨卫星星座以其通信距离短,波束范围广等优势在未来天地一体化通信系统组网蓝图当中占据着至关重要的地位。在5G NR(New Radio)的相关技术中,随机接入技术是实现用户上行初始同步,有效建立星地数据传输链路的关键前提。
深度学习(Deep Learning)技术的快速发展,开启了未知的机器智能时代,也正逐渐并深刻地影响和改变着我们的日常生活。然而,深度学习技术需要依赖大量的带有标签的样本数据才能发挥其巨大的作用。实际应用中,获取大量带有标注的数据需要花费巨大的代价,且某些领域并不存在巨大的数据去适应深度学习模型进行训练。当训练数据量较少时,往往会造成模型过拟合。因此,小样本学习(Few-shot learning
随着数据采集手段的不断增多,真实数据往往由多个模态组成或来自多个来源,这样的数据称为多视图数据。对多视图数据进行机器学习任务称为多视图学习。如今,多视图聚类作为多视图学习的一个热门领域已经引起了研究者广泛的关注,它提供了一种将多视图数据划分成簇的方式。目前,大多数多视图聚类算法都假设所有的视图是完备的。但是,在实际应用中,每个视图数据可能存在样本的缺失,从而导致不完备的多视图数据。现有的多视图聚类
旋转机械是机械设备状态监测与故障诊断工作的重点,而滚动轴承是机械设备常用的部件之一,同时也是易损部件之一。机械设备的故障诊断越来越受到人们的重视,在目前的故障诊断领域,通过实时有效的检测方法采集到足够的信号样本并且客观地分析机械设备运行的状态信息,对判别不同工况下的故障设备状态以及对故障类型实现准确诊断具有重要意义。目前机械设备故障诊断主要有两种思路:一种是对机械设备的振动信号进行时频域分析,这种
视频监控下的人体异常行为检测与识别是公共安全领域的研究热点,但由于现实生活中的视频监控存在人体遮挡和相似异常行为难以区分的缺点,导致人体异常行为检测与识别效果差、实时性低。本文对基于视频监控的人体异常行为检测和识别算法进行研究,将深度学习技术应用于人体异常行为检测与识别任务中,构建了异常行为检测与识别两级级联网络,实现对公共区域的人体异常行为有效检测和识别。本文的主要研究内容如下:1.针对复杂场景
无线传感器网络作为一种新兴的移动通信技术,为无线通信和物联网行业的发展带来了广阔的前景。然而网络覆盖的优劣程度将直接影响网络的性能,有效的网络覆盖不仅能够提高网络的监控能力,而且能够改善网络的性能,延长网络的生命周期。本文在现有虚拟力覆盖算法的基础上,利用接受信号强度指示(Received Signal Strength Indicator,RSSI)构造新的虚拟力模型,分别对信号规则传输和信号不
乳腺癌是全球范围内危害妇女身体健康的最常见恶性肿瘤之一。钼靶X线摄影是临床上乳腺癌检测的主要影像学方法,在降低乳腺癌死亡率上发挥了重要作用。随着我国经济的持续发展以及妇女防治乳腺癌意识的提高,钼靶X线检查在我国各级医疗机构中得到大量应用。由于钼靶摄影对乳腺癌的检出率大约为0.3%~0.5%,健康妇女每年都参加钼靶摄影检查是对社会医疗资源的浪费;其次,乳腺钼靶检查存在一定的局限性和危害,如假阳性结果
心脑血管疾病一直是威胁全世界人民生命健康的重要隐患,具有非常高的发病率,已成为影响国民身体健康、阻碍经济发展的公共性和社会性问题,对于心脑血管疾病的预防和治疗刻不容缓。心律失常是最为常见的心血管疾病之一,其异常主要有两种表现形式,基于单个心拍波形变化的心律异常和基于一段时间内多个心拍节律变化的心律异常,两种形式的心律异常都会对人体产生不良的影响。近年来,计算机技术在辅助诊断治疗领域不断发展,心电信