【摘 要】
:
实例分割是计算机视觉中最重要和最具挑战性的问题之一。随着深度学习相关技术的发展,一些基于卷积神经网络的实例分割算法取得了较好的性能。但是,这些方法都依赖于大规模的强监督训练数据。而获取大量像素级别标注数据的成本十分昂贵,这严重制约了实例分割算法在各个领域中的应用。弱监督实例分割提供了一种在缺乏足够的像素级别标注数据时解决实例分割问题的思路。现存的弱监督实例分割方法都是基于候选区域的,通常可分为三步
论文部分内容阅读
实例分割是计算机视觉中最重要和最具挑战性的问题之一。随着深度学习相关技术的发展,一些基于卷积神经网络的实例分割算法取得了较好的性能。但是,这些方法都依赖于大规模的强监督训练数据。而获取大量像素级别标注数据的成本十分昂贵,这严重制约了实例分割算法在各个领域中的应用。弱监督实例分割提供了一种在缺乏足够的像素级别标注数据时解决实例分割问题的思路。现存的弱监督实例分割方法都是基于候选区域的,通常可分为三步:(1)提取候选区域;(2)对候选区域评分;(3)非极大值抑制。现有的弱监督实例分割算法的主要瓶颈在于它们通常使用启发式策略来对候选区域进行评分,具体地说,它们利用注意力图和人为设计的评分规则为候选区域分配类别分数,这极大地影响了算法的分割性能。本文使用可学习的深度网络对候选区域进行评分。我们提出一种新的基于区域神经网络的弱监督实例分割算法。为了解决候选区域类别标注缺失的问题,我们提出了一种注意力引导的候选区域伪标注分配策略,该策略利用注意力图中的极值点以及极值点与候选区域之间的空间关系给候选区域分配伪标注。本文还在候选区域级别的分类网络中使用了开放集损失函数,以更有效地处理背景候选区域,提高算法鲁棒性。在基于区域神经网络的弱监督实例分割算法的基础上,本文提出了一种基于图神经网络和多实例学习的候选区域评分网络。利用注意力图上的极值点来构建包并建立多示例学习损失函数。我们还通过图神经网络来建模包中候选区域之间的相关性。在公开数据集PASCAL VOC 2012和Microsoft COCO 2014上的实验结果证明了本文提出的方法的有效性。
其他文献
电容的容值与极板间的距离、介质有关,通过构造合适的前端电路,电容数字转换器(Capacitance-to-Digital Converter,CDC)可以测量湿度、压力、位移等物理量,因而CDC有着广泛的应用场景,如压力检测、湿度检测、液位检测、位移检测、加速度检测、触摸屏等。为了满足不同的应用场景对CDC的不同要求,需要低功耗、高精度、宽测量范围的电容数字转换器。本文对电容数字转换器的理论进行分
配电网络深入各负荷中心,运行环境较为复杂,输电线路容易与树枝或建筑接触,极易形成高阻接地故障。发生高阻接地故障时,由于过渡电阻值很大,故障特征十分微弱。即使小电阻接地系统在发生单相高阻接地故障时,故障信息也十分微弱,传统零序过电流保护在过渡电阻达100Ω左右时就难以可靠动作。此外,灵活接地系统在发生永久接地故障时,将投入小电阻与消弧线圈并联接地,使系统从小电流接地方式转变为大电流接地方式,从而增强
今秋开学前夕,为解决如何让刚上完幼儿园的孩子能顺利地进入小学学习,上海市教委推出了以"学习准备期"为主要内容的改革措施。这一举措能否达到预期目的?上海市这一地方化改革举措对其它地区是否有借鉴意义?为此,本刊记者进行了专题采访。
面对复杂多样的环境,机械臂怎样快速高效地完成任务是一个很大的研究热点。近几年来,随着深度强化学习技术的兴起,这种技术在机器人上的应用也受到了广泛的研究。利用强化学习算法,可以使得机械臂在不断试错中自主地去优化规划策略,最大化得到的奖励,从而实现最终的规划目标。本文将在堆积物体抓取、B超探头移动以及模仿图像三个方面分别讲述深度强化学习在机械臂上的应用研究,通过将深度强化学习与其他算法相结合,实时地规
无线传感器网络(Wireless Sensor Networks,WSNs)是网络物理系统(Cyber-Physical Systems,CPS)和物联网(Internet of Things,IoT)的关键组件。WSNs有时部署在恶劣环境,容易遭到外界破坏,从而网络被分割成多个孤立分区。这种情况下,网络需要一种有效的连通恢复策略,使网络恢复正常工作。连通恢复是WSNs的基本问题之一,直接决定网络
随着我国现代化建设水平的不断提高,城市地铁设施作为地下空间开发利用的重点,得到了迅速发展,受线路规划、空间冲突等因素的限制,新建地铁线路邻近或近距离穿越既有桥梁难以避免。因地铁隧道盾构施工,周围土体受到扰动,导致邻近的桩基产生附加内力与变形,改变桥梁受力状态甚至威胁桥梁结构安全,这对建设工程造成极大的挑战。如何确保既有桥梁的正常运营及结构安全已成为城市地铁隧道盾构施工领域重要的研究课题之一,科学分
光固化技术具有高效、安全、环境友好等优点被广泛运用在印刷、涂料、3D打印、电子器件封装、食品包装、胶黏剂、牙科填充材料以及生物等领域。传统被用作光固化的光源的高压汞灯具有高功耗、发热量大、汞污染、臭氧污染等缺点。发光效率高、能耗低、无污染、操作方便的发光二极管(LED)光源取代高压汞灯是行业发展未来的方向。市售商用的光引发剂2,4,6-三甲基苯甲酰基-二苯基氧化膦(TPO)具有高迁移率的缺点,应用
文本作为信息传输的重要媒介,存在于各类文件、票据及自然场景中,呈现着方向、尺度、颜色和形状的多样性。随着互联网的发展和计算机的普及,文本检测与识别技术被广泛地应用于图像搜索、自动翻译、视觉辅助、单据识别等领域。近年来,随着深度学习的蓬勃发展,文本检测的研究趋势逐渐从检测水平文本到任意方向、乃至任意形状的场景文本;而文本识别的研究也从识别机打文本向多语言、任意形状场景本文进化,能够面向越来越多的工程
随着乡村振兴战略的提出以及相关政策的有效执行,农村经济得到充分发展,农村地区用电负荷明显增长,部分地区分布式光伏的渗透率也不断提高。因此,如何适应农村负荷空间分布不均及变化幅度大等特点,同时考虑分布式光伏支撑作用,提出含过渡策略的变电站规划方法,是当前农村配电网规划的关键。为此,本文开展了计及分布式光伏的乡村变电站多阶段升压规划研究,主要工作和研究成果总结如下:首先,本文提出一种考虑分布式光伏接入
二氧化钛(TiO2)成本低廉,无毒和安全稳定,其作为钠离子电池嵌入型负极材料的理论比容量达到335 m A·h·g-1,有较好的应用前景。然而,由于带隙宽和导电性较差,TiO2的实际比容量低和倍率性能差,这限制其在钠离子电池中的实际应用。通过与导电基质复合、构筑纳米结构和杂原子掺杂,能够有效地改善TiO2的储钠性能。基于此,本论文创新性地利用无定型二氧化钛微球(Am TSS)作为杂原子掺杂前驱体,