卷积神经网络旋转不变性的研究及应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:x117799589
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着深度学习的发展,尤其是卷积神经网络(Convolutional Neural Networks,CNN)的更新迭代,图像分类及目标检测方法获得了显著进步,但即使是最先进的模型也仅具有非常有限的旋转不变性。当输入数据在空间经过旋转后,由于原始模型的滤波器是在直立样本中打磨学习,因此模型将旋转前后的图像特征视为完全不相同的两类,导致最终的识别效果大幅度下降。已知的解决方法有训练数据的增强,以及通过全局地合并旋转等变特征来增加旋转不变性。这些方法或者增加了训练的工作量,或者增加了模型参数的数量。为解决上述问题,本文中通过引入一个可插入到现有网络中的模块,将旋转不变性直接合并到卷积神经网络的特征提取部分中。该模块不带有可学习参数,不会增加模型的复杂度。同时,仅通过训练未旋转的数据,就可以在旋转的测试集上表现良好。这些优势将适用于生物医学、天文等获取样本困难且目标不带有方向性的领域,以及工业等对成像速度有较高要求的领域。本文主要研究内容包含以下四个部分:1.针对卷积神经网络缺乏旋转不变性的性质,本文通过令卷积前后的特征层满足旋转等变性的方式,最终使整个神经网络的结果具备旋转不变性。经过推演,当旋转角度∈{0,90,180,270}°时,特征编码完全相同;当处于任意旋转角度时,特征编码仅存在较小区别。2.设计基于改进LBP算子的区域旋转层(Regional Rotation Layer,RRL),以插件形式嵌入到卷积神经网络中,而无需对上下文进行大幅度的修改。邻域像素点的位置与图案的最大LBP描述符相关;实施改进LBP的次数由卷积步长和特征图尺寸所决定,卷积核以滑动窗口在特征层滑动时,每次所覆盖的区域便为执行改进LBP算子的位置。3.插入区域旋转层至现有卷积神经网络中,包括常见的标准卷积结构和被大规模使用的残差结构,以及深度可分离卷积。选择现今在分类任务与目标检测任务中表现较好的骨干网络,融合区域旋转层并探索能发挥最大作用的融合方式。在多种数据集进行推理训练,验证了改进模型的有效性。4.设计并实现了肺炎辅助筛查系统,核心算法模块使用添加区域旋转层的目标检测网络。用户在系统上提交患者肺部的X光片,便可获得病灶的预测区域,以此来辅助诊断。
其他文献
目标检测作为人工智能学科中与生活最为贴近的研究热点之一,在自动驾驶、人脸检测、智能监控、医疗及工业检测等场景都有着广泛的应用。随着深度学习的发展,目标检测任务在准确率越来越高的同时,神经网络模型也越来越复杂。本文通过对目标检测网络以及神经网络压缩算法的研究,以端到端目标检测网络为切入点,着手于知识蒸馏、模型剪枝及参数量化三个方向对目标检测网络的压缩问题进行了研究。希望给目标检测网络的压缩问题带来新
随着机动车辆在全世界的逐渐普及,人们在便利生活的同时也伴随着交通安全事故。根据世界卫生组织的统计结果表明,全球每年死于交通安全事故的人数超过一百万人,其中接近五分之一的事故是由驾驶员分心行为所引起。驾驶员安全行为检测是对驾驶员在驾驶机动车辆过程中出现的不安全类别行为进行检测预警,如使用手机、抽烟和喝水等不安全动作。在图像检测领域,传统机器学习对待检测图片进行人工特征提取和特征匹配,其次使用支持向量
人体跌倒干预目前多局限于跌倒检测,以便检测到后及时送医以避免造成更大损失,但是并不能避免跌倒发生。人体跌倒碰撞前行为检测旨在人体发生跌倒碰撞前检测跌倒行为的发生。本文开展人体跌倒碰撞前行为检测研究,分别使用可穿戴惯性传感器和Kinect摄像头采集人体跌倒的惯性传感数据和视频序列数据,基于可穿戴传感器、Kinect摄像头和多视角融合方法进行人体跌倒碰撞前行为检测研究,适用于多环境下人体跌倒保护。论文
在深度学习技术快速发展的今天,现有的文本摘要技术也因此受益,处于蓬勃发展期。但是生成式文本摘要技术发展至今,依旧存在着句子冗余/错漏,内容覆盖主题不足,句子流畅度不高以及训练效率低下且难以部署的问题。本文根据对生成式文本摘要技术的研究,结合现有前沿技术,由此分析、设计并实现了胶囊-注意力指针模型,在该算法的基础之上,完成了相应的文本摘要高并发微服务复合架构的设计与实现。本文的结构以及具体工作如下:
准确识别计算机断层扫描图像上的恶性肺结节中是早期发现肺癌的关键。但这是一项繁琐和困难的任务,因为需要放射科医生手动标记结节位置。随着深度学习技术的引入,基于卷积神经网络的计算机辅助结节自动检测系统被开发用于肺癌早期的检测和分类筛查过程,显著地提高了放射科医生的诊断质量和效率。本论文重点研究了基于3D卷积神经网络的肺结节检测以及分类方法,研究工作主要分为以下两个部分:(1)基于双路径U-Net网络的
关系抽取是自然语言处理领域重要的研究方向,如何有效地从大量的文本中提取出关系事实,是近年来的研究热点。现阶段的主流方法通常使用深度学习技术进行关系抽取,这些方法大多集中在单个句子中的关系抽取。然而,大多数关系事实只能从一个段落或者一篇文档中抽取。由于段落和文档输入较长,现有的深度学习方法无法准确在文本中定位关系事实位置,并且不能对跨句子的关系进行推理。针对上述问题,本文结合图神经网络技术构建实体图
音乐自动标注的目的是识别一段音乐音频所涉及的各种社会标签,包括但不仅限于音乐的乐器、年代、情感和流派。目前,基于卷积神经网络的音乐自动标注算法已经成为解决该任务的主流方法之一。本文调研和分析现有基于卷积神经网络的音乐自动标注算法,发现卷积神经网络中的卷积和池化操作造成了的空间特征的损失、缺少基于数据增强的音乐自动标注算法的研究、缺少基于音乐自动标注算法的工程应用的问题。基于此,本文研究基于胶囊网络
近年来,随着人工智能技术的发展,深度学习作为一种重要技术应用于自然语言处理和机器视觉等前沿领域。同时,动态演化网络广泛存在于现实生活中,包括社交网络、科研引用网络以及交通网络,动态网络的研究也成为了学术界的研究热点之一。目前学术界大量地将深度学习技术应用于网络表示学习的研究,通过对网络中的节点进行表示学习取得节点向量,从而方便对非结构化的网络图数据进行机器学习任务,包括节点分类、链接预测和可视化等
集群系统协同控制是通过成员之间的信息交互,完成更加复杂的任务,已经成为当下军事和民用领域提升工作效率的重要手段。一致性问题作为集群控制的基础问题,是当下的热门研究话题。本文以系统模型不确定、存在外部扰动和具有通信约束等因素对集群系统行为的影响为切入点,研究集群鲁棒一致性控制方法,使系统稳定实现一致性跟踪和二部一致性等行为。主要研究工作及创新性成果如下:1.研究具有模型不确定性和未知扰动的集群系统鲁
与单个飞行器相比,飞行器集群具有低成本、高效率、抗损耗等特点。因此飞行器集群在战场上得到了广泛的应用,是未来战场环境发展的重要趋势,同时也给国防防御技术带来了巨大的挑战。采用低成本集群对抗集群的作战方式,能够有效的消除飞行器集群带来的威胁。论文面向飞行器拦截对抗空中集群目标的场景,在实际作战中飞行器为拦截导弹,拦截对象为集群无人机,研究多飞行器智能协同制导与控制问题,实现多飞行器自主协同作战,对未