基于候选边界点的交互式图像分割方法研究

来源 :西华大学 | 被引量 : 0次 | 上传用户:guokm01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体大数据以及人工智能的飞速发展,如何从海量数据之中提取用户需要的有用数据已经成为了人工智能发展的迫切需求。其中,图像分割是多媒体数据分析与理解领域中一个基础并且重要的研究内容。由于计算机对图像内容的解释并不完整,近年来增加人为干预的交互式图像分割算法被深入研究,并且已经被广泛应用于图像处理的众多领域中。交互式图像分割的研究目的是为了通过简单而直观的人为标注,进而能够快速并准确地从输入图像中提取出具有高级语义特征的前景目标。目前深度学习在众多图像分割任务应用中取得了越来越好的效果,其中大部分分割算法都使用了端到端的自动分割网络,然而在实际情况中很多场景仍需要使用交互式的图像分割方法,比如在放疗靶区的标注,又或是在自动分割结果不理想时而需要用户手动改正,除此之外,在训练深度学习模型时通常需要人为标记许多图像分割结果作为训练集,使用高效的交互式分割工具能够在制作图像训练集时更便捷地标注图像。考虑到深度学习的优越性能,利用它来做交互式图像分割,可以减少用户交互次数以及花费的时间,从而得到更高效的交互式分割工具。通过对交互式图像分割的研究,能够发现交互式图像分割算法能广泛应用于医学影像处理、生物特征识别、无人驾驶等领域,但同时也存在着标注困难等一系列问题,因而需要更加简单高效的交互式分割方法。本文主要的研究内容和创新点包括以下几个方面1提出一种新的交互方式,在图像预处理环节,用户仅需在图像目标上标记目标中心与目标边缘两个点,就能够准确迅速的找出目标候选边界点,与现有的方法(边界框、画线、标记前景与背景点)相比,本文方法在大大节省标记时间的情况下同样可以得到与现有流行方法精度相同的结果。2在获得图像目标候选边界点后生成heatmap。具体地,本文在每个候选边界点都生成一个单独的二维高斯中心,并将此heatmap作为本文的分割网络输入中的一个额外的通道,与原图像的RGB通道连接起来作为4通道输入。本文的分割网络学习将这些信息转换成匹配这些候选边界点的目标对象分割。3改进现有的分割网络框架,本文将ResNet101作为骨干网络,并在此基础上改进了残差块结构,以及删除了网络最后的全连接层和第4第5阶段的最大池化层来保证图像分辨率,同时加入了空洞卷积来保持与原网络相同大小的感受野,最后本文网络使用金字塔场景分析模块,目的是为了在最后的特征图中添加全局上下文信息。
其他文献
很多专家认为策略和写作过程是区别成功的写作者与不成功的写作者的重要标志。但是,在最近的二十年间已经发表的6000篇论文中,关于元认知和认知因子策略的论文仅占了3.4%。本
饱和砂土及粉土地震液化问题是岩土地震工程中一个重要的研究课题。在多种可行的防治液化措施中,最普遍的方法是采用碎石桩复合地基。结合碎石桩复合地基对碎石桩的密实、排
在高中英语的课堂实践中,写作可以说是学生课堂中需要重点把握的一个方向,其在学生的课堂实践培养中,属于一个需要重点掌握知识内容,教师在教学的过程中,对于学生在写作能力
影响教学难度因素的研究多停留在对知识本身的难点讨论,部分研究者涉及到教师的自身教学能力的影响。但在重点高中依然会存在学生成绩大面积下滑的情况,这引起了笔者的关注。
本论文主要分为两部分。第一部分芳基苄醚及羧酸苄酯脱苄基反应苄基是有机合成中一种非常重要的保护基,被广泛应用于保护羟基,羧基,氨基,巯基等。苄基保护方法简单、试剂便宜
具有层状类钙钛矿结构的La2Ti2O7(LTO)晶体,是优良的高温铁电材料,广泛应用于高温传感器、电光设备等方面。长期以来,人们对LTO的研究主要集中在多晶陶瓷和薄膜方面,对LTO单晶
随着社会工业化的发展,噪声污染越来越严重,它对人身体和心理造成一定的有害影响。噪声影响人的听力,使人心情烦躁,严重影响了人类的生活。因此减弱噪声是一个很有意义的课题
随着天文观测技术与手段的迅猛发展,越来越多的地基与天基望远镜建成并且逐步投入使用。在如此多的观测设备投入使用的同时,观测产生的数据也呈现出爆炸式的增长,如何从海量
元认知理论的研究越来越受到教育教学领域研究者的关注,但很少有人关注元认知意识与高中英语学习成绩的关系。此外,几乎所有这些论文都仅仅从听、读、写等某个方面分析了元认
随着时代的发展,思维导图渐渐在中国日常教学中兴起。思维导图以其独特的优势特点深得师生的喜爱。思维导图不但可以帮助学生整理扩充词汇短语和句式,还可以帮助学生对英语写
会议