基于AOG的人体图像数据增强算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xgz521521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体图像数据是一类重要的数据,具有多样性丰富、标签复杂且标注难度大的特点。在实际应用中,利用图像生成方法扩充人体图像数据已经成为一种趋势。然而,目前的人体图像数据增强算法或是所扩充图像数据的外观多样性不足,或是没有考虑到所扩充图像数据的姿态多样性,或是使用条件苛刻,并不能满足实际任务的需要。针对现有人体图像数据增强算法不能同时兼顾简便性、有效性及多样性的问题,本文引入与或图(AOG)模型的概念,研究了AOG在人体图像数据增强领域的应用。本文的工作主要从以下几个方面展开:(1)提出了一种基于AOG的人体图像数据增强算法。该算法利用AOG构建人体图像表示模型,利用组合重构采样扩充人体图像数据。其中,在AOG的构建中,将人体图像分解为外观和姿态两部分,使用一个人体外观AOG对人体图像的外观多样性进行表示,使用一个人体骨架AOG对人体图像的姿态多样性进行表示,得益于AOG的组合重构性质,人体外观AOG和人体骨架AOG能从有限的数据中进行学习,并产生更多的人体外观样本和三维人体姿态样本。最后基于构建的人体外观AOG和人体骨架AOG,通过组合人体外观样本和三维人体姿态样本生成新的人体图像,实现人体图像数据增强。(2)构建了人体外观AOG。在现有基于AOG的人体表示模型中,短语结构语法和属性语法被用于描述人体外观,但现有短语结构语法和属性语法的结构并不适用于人体图像数据增强。本文通过对现有文献中的短语结构语法和属性语法进行改进与整合,给出了人体外观AOG。该模型使用无背景组件像素块作为图像模板,采用参考人体运动结构的分解层次,更适用于人体图像数据增强任务。为了保证人体外观AOG的使用简便性,又提出了一种配套的学习方法,允许从普通人体图像数据中进行学习。此外,本文还给出了一种属性约束的采样方法,可以生成不同属性约束等级的人体外观样本。(3)构建了人体骨架AOG。在现有基于AOG的人体表示模型中,依赖语法被用于描述人体姿态,但现有描述二维人体姿态的依赖语法并不适用于人体图像数据增强。本文通过对现有文献中的依赖语法进行改进,给出了人体骨架AOG。该模型描述的是三维人体姿态样本空间,且所描述三维人体姿态的有效范围和概率分布与AOG的概率模型相关联,更适用于人体图像数据增强任务。为了保证人体骨架AOG的使用简便性,又提出了一种配套的学习方法,允许从二维人体姿态数据集中进行学习。此外,本文还给出了一种相应的采样方法,用于生成三维人体姿态样本。(4)确定了组合人体外观样本和三维人体姿态样本生成人体图像的方法。本文参考现有人体图像生成方法,给出了一种基于人体外观和三维人体姿态的人体图像生成方法。该方法先组合人体外观样本和三维人体姿态样本构建一个伪三维人体模型,再对伪三维人体模型进行透视投影,接着使用平面几何变形方法调整投影结果,最后添加背景生成人体图像。在INRIA数据集中,本文算法仅以12张真实图像扩充训练得到的SVM分类器的准确率达到了89.7425%,比241张真实图像训练得到的准确率高了7.8153%;在OTB100数据集中,本文算法使用一张图像样本扩充训练得到的SVM分类器,对同类图像样本的分类准确率达到了91.0714%。所以本文算法所生成人体图像样本在训练图像数据不足时能有效提高所训练图像分类器的性能。
其他文献
随着互联网技术的快速发展,基于传统搜索引擎技术的信息获取方式已很难满足人们对于知识获取的需求,使用者仍然需要抽出额外的时间对搜索到的网页链接进行筛选,以确保得到最满意的信息。因此,能够快速精准地获取到有用的信息一直是人们愿望。智能问答系统的出现弥补了这一缺点,它可以通过用户的自然语言问题理解并分析出用户的意图,进而给出最直接的答案。另一方面,知识图谱的相关技术问题又是人工智能方向的不可缺少的一部分
随着互联网技术的不断发展,人们获取知识的途径以及种类越来越多。通过本体可以描述某个特定领域内的知识,并将该领域内的知识对象组织起来以帮助相关人员更加清晰、准确的了解相关元素和关系,从而为知识的进一步加工处理提供基础。由于本体构建者的信息源是分布自治的,他们往往采用不同的建模方式或本体描述语言,但这些本体所描述的内容在语义上有时会有有重叠或者关联,这就造成了本体的异构。本体的异构性导致分布式本体之间
水苏糖属于α–低聚半乳糖,是四碳糖,也是大豆寡糖的主要功能性组分。试验旨在研究日粮添加不同水平的水苏糖对肉仔鸡生产性能、养分代谢率、非特异性免疫功能、盲肠内容物粪臭素浓度、肝脏细胞色素P450(CYP450,CYP)基因表达和酶活性的影响,探索水苏糖对肉仔鸡粪臭素产生的作用效果、作用机制及适宜添加量。试验采用单因素随机化试验设计,选取360只1日龄爱拔益加(AA+)肉仔鸡,随机分为6组,每组6个重
近年来,随着城市化、工业化的快速发展,环境污染,尤其是水污染问题,日益严峻,水污染防治刻不容缓。吸附法是一种有效、高性价比的污水净化方法,吸附剂是吸附法的关键。常见的吸附剂有活性炭和聚合物等,活性炭吸附剂制备过程中能耗高,且易产生温室气体;聚合物基吸附剂生产工艺较复杂,且使用过程中易造成二次污染。制备生态高效、价廉量丰的吸附剂是吸附法污水防治的关键核心。黏土储量丰富,具有独特的层状结构和离子交换能
柔性制造系统工作时,多个工序使用同一种资源。一旦资源分配不当,就会发生死锁。死锁会导致系统无法正常运行,解决制造系统的死锁问题有重大工程意义。Petri网是一种有效的建模工具,基于Petri网理论,发展了很多死锁预防策略。现有基于区域理论的死锁预防策略,一般通过禁止首遇坏标识为系统设计最大许可活性控制器。若设计控制器时只考虑首遇坏标识,则合法标识可能被控制器禁止。因此为首遇坏标识设计控制器时,还需
随着互联网的快速发展和广泛应用,人们已经逐步从信息匮乏的时代步入信息超载的时代。面对如此爆炸的信息时,通常无法快速地定位到有价值的内容。文本分类作为自然语言处理方向的基础研究,有着非常深刻的研究意义及广泛的应用前景。在近几年,深度学习逐步取代传统的机器学习方法,已渐渐成为文本分类领域的主要研究方向。深度学习,将特征提取和分类的过程融为一体,取代了传统的文本分类方法,可自动获取数据的特征信息。深度学
输电线路所在的地理环境或自然条件一般较为恶劣,线路位置相隔较远,其环境气象监测大多采取人力巡检等传统方式。人员定期检查维护的方式难以实时了解设备的运行状况,且检测准确率也难以保证,不利于及时检查到高压输电线路的安全隐患,效率较低。随着近年来物联网技术的迅速发展,相关的智能监测技术也在蓬勃发展。环境气象监测在工业领域的应用,也愈来愈受到重视。因此,面向输电线路的环境气象监测智能化、实时化成为了迫切的
近年来,极化码已成为信道编码领域的研究热点之一,并且已被用作5G增强移动宽带业务(Enhanced Mobile Broadband,eMBB)场景中控制信道的编码方案。大多数极化码的研究都是基于码长N=2n,然而实际应用中需要更灵活的码长。使用大于2维的高维内核构造极化码通常可取得更好的性能,将高维内核与2维内核级联构造多维极化码可获得更灵活的码长。本文对多维内核极化码实现任意码长的构造方法进行
白山市是中国的主要木材产区之一,1994年7月,国家林业部批准在白山市建立全幅员的国家森林旅游区。白山市江源区作为东北重点林区县,区域内森林覆盖率达83%,是东北林产品的重要加工基地。江源区农民拥有的耕地面积很小,林业收入是农民收入的主要来源,农户对林业依赖性很高。在林权制度改革过程中,林地的产权情况和产权应用政策发生变化,农户的林业经济发展情况也随之改变,集体林权矛盾比较突出,不仅给江源区林权改
高分二号卫星能够提供空间分辨率优于1m的全色遥感图像和优于4m的多光谱遥感图像。其中全色与多光谱遥感图像的配准效率会直接影响到后续图像处理和分析的结果。本文以基于SIFT的图像配准方法为研究基础,针对其在配准高分二号全色与多光谱遥感图像时,存在的配准速度较慢和配准精度较低的问题进行改进,提出了基于信息熵网格划分的改进SIFT遥感图像配准算法,并将改进算法以插件形式集成到遥感信息处理平台MHMap