基于语义的图像全景分割

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:redhatping
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近十年来随着计算机计算能力的大幅提升以及图像认知技术的迅猛发展,很多基于图像的认知应用得到了学术界和资本界的青睐,最为典型的落地场景有智慧安防、自动驾驶、无人机等。在这些基于图像认知的应用中,图像语义分割、实例分割、全景分割是作为智能体感知外部环境的一个重要手段。在这些图像分割细分方向上,全景分割是最为复杂和具有落地意义的,它要求对图像中的每一个像素点赋予一个唯一的语义类别和实例识别号,本文基于卷积神经网络架构,对图像进行了基于语义划分的全景分割理论研究和实践。为了刻画实例对象的轮廓边界,文中提出了两种实例边缘的数学模型,分别为基于极坐标系下的角度、距离来描述轮廓边界点;基于笛卡尔坐标系下的三次样条曲线来描述实例边界轮廓。基于极坐标系下的轮廓边缘是以实例内部的一个点为原点,进行等间隔旋转角度对边缘采样得到;而基于笛卡尔坐标系下的采样点而言,则是基于等弧长间隔采样得到的。极坐标系中采样点进行依次首位相接即可得到边界轮廓;笛卡尔坐标系中则是对采样点进行三次样条曲线插值得到实例的边界轮廓。为了验证两种实例边界建模的差异,本文分别基于这两种不同的实例轮廓建模方法搭建了全景分割网络,其中包含语义分割和实例分割两路并行子分支,实例分割分支无需预定义锚框,而是直接回归所定义的极坐标系距离向量和三次样条曲线系数,相比于基于锚框的实例分割方法,极大的简化了网络复杂度和降低了模型参数量。全景分割架构中自行定制了U-Net网络作为其骨干网进行特征提取,将U-Net中的降采样和升采样过程中同等尺度的特征图进行拼接,有效地挖掘不同抽象维度下的输入特征。为了将语义分割和实例分割的输出相融合以解决标签冲突问题,文中提出了一种简单有效的融合算法。全景分割架构基于Tensorflow框架开发实现,针对不同的分类或回归任务,设计了不同的损失函数指标,并基于阿里云ECS弹性计算平台对模型进行训练和性能验证。本文实验使用百度Apollo Scape街景数据集中的9600张图像作为训练集和验证集,衡量的指标包括实例分割中的平均精确度、平均召回率以及全景质量(Panoptic Quality),全景质量中包含分割质量和检测识别质量。实验结果表明,在提升极坐标系和笛卡尔坐标系中的实例边界采样粒度,可以显著提升模型的性能指标,但是当采样粒度达到72个点以上时,再进一步提升采样粒度效果并不明显,此时性能受限于网络模型的固有能力和轮廓边界描述的特征。同时文中还对不同的骨干网进行全景质量和模型参数对比,本文提出的定制化的U-Net具有良好的性能且用了最小的参数量,此外还对极坐标系和笛卡尔坐标系中实例轮廓表征的两种方法进行性能横向对比,结果表明基于三次样条曲线的轮廓表示方法使用的参数量比基于极坐标系的多,对于自行车、行人、骑行者等轮廓边界较为复杂的实例对象而言,三次样条曲线具有明显的优势;对于汽车、公交车此类大体积实例对象,两种方法取得的性能相当。
其他文献
随着当今社会深基坑支护越来越多,给土方外运也越来越困难,多道环形支撑深基坑土方外运一套可行的出土柱板挡土结构新技术和工艺新技术应运而生。
最优化问题是工程实践和科学研究中主要的问题形式之一,其中,约束优化已渗透到我们生活中的方方面面,但是在求解约束优化问题时往往面临着评价次数过高、求解费时的困难。因此,在评价次数有限的情况下提高约束费时问题的优化性能非常重要。本文针对单目标约束费时问题提出了两种改进的优化算法,主要工作如下:一、代理模型辅助的初始可行解产生方法。采用约束保持法求解单目标约束优化问题时,如何能够快速的产生初始可行解是首
近年来,环境污染事件层出不穷。2010年汀江重大水污染事故造成直接经济损失3187.71万元人民币,2011年云南曲靖铬渣污染事件造成“死亡村”。环境污染造成的危害使得环境恶化和巨额经济损失,不利于国家又快又好的发展。对污染受害人进行合理的赔偿,是保护公民合法权益的必经之路,但巨额的赔偿又使企业和政府陷入困境。借助发达国家解决此类问题的方法,2008年环境污染责任保险应运而生,这是以企业发生污染事
随着互联网的发展,海量的数据随之诞生。文本数据作为人们接触最多的信息形式之一,其中包含着很多有价值的信息,如何从复杂冗余的文本数据中获取有价值的关键信息非常重要。
氢能作为一种清洁、高能、来源丰富的可再生能源,在氢能发电、氢燃料电池等诸多领域具有广阔的应用前景。但氢能产业化进程受制于氢的制备和储运技术的发展,不可避免的是二氧化碳排放和安全高效储氢问题。结合电解制氢和有机液态烃化物储氢的制氢储氢一体化技术能最大限度的改善电极的选择性提高加氢效率,前提条件是获得高催化活性、高选择性和化学稳定性的固体聚合物电解质膜电极。Pt的催化活性优异,但失之于价格昂贵且易中毒
由于高清视频流,云和5G等带宽消耗服务的出现,流量容量需求日益增长。高阶调制带来的高带宽利用率和相干接收带来的高灵敏度使得相干光通信在核心网的传输中举足轻重;在移动通信的高速发展的时代中,相干光通信技术在接入网中同样大放异彩;相干光通信与波分复用、光正交频分复用的结合使得城域网容量大大增加。如今,无线网络立足5G,正向第六代移动网络发起冲锋,光通信也同样面临架构和技术上的更新。新的技术包括但不限于
随着老年人口的增多和预期寿命的不断延长,我国需要护理的失能老人不断增多。随着生活质量的提高,护理对象对服务质量的要求更高,而长期护理行业发展不完善、护理工作艰苦、传统思想观念影响等原因,导致护理人员的工作压力大、人员流动性强、护理质量不高等,因此老年长期护理从业人员在从事护理工作时面临着极大的挑战。老年长期护理从业人员这个群体亟需社会关注,亟待社会支持。文章以马斯洛需求层次理论和社会支持理论为基础
自2019年起,我国新的生活垃圾管理条例正式开始施行,我们以后在扔垃圾前都要先将垃圾仔细分类,但是由于日常生活垃圾品类繁多,各种垃圾分类标准也是五花八门,一时间人们恐怕难以快速正确地进行垃圾分类。机器学习算法发展快速且在许多领域都有应用场景,利用算法对图像识别可以大大提高垃圾分类的效率,为人们的生活带来便利。本文利用网上搜集的垃圾图像数据集,首先以支持向量机和K近邻为代表的传统机器学习算法为基础,
交通拥堵是现代城市面临的主要问题之一。开发窄小电动通勤车应用于日常城市交通,是解决该问题的有效方法。窄车身主动倾斜电动车属于新型非标准车辆,体积小,车身窄,通过主动倾斜技术改善转弯时因转向内侧轮胎受力过小,易向外侧发生侧翻危险的情况,从根源上防止侧翻。针对以往相关研究中存在的,难以确定车辆倾斜动作对稳定性的影响及其影响程度、未形成具体的控制策略、相应控制策略下未对系统的动态性能加以探究以及没有相应
目的:建立快速、简便、准确鉴定中药指纹图谱中二氢黄酮类化合物结构的方法;方法:采用电喷雾-离子阱-飞行时间串联质谱(ESI-IT-TOF)技术配合在线柱后衍生技术,对枳壳甲醇提取