交互式堆垛纸箱机器视觉定位算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:mibaoaiai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
货物识别定位技术是物流自动化领域的核心技术之一,但仍然无法达到工业级应用水平。本文以实现工业应用级货物识别定位算法为目标,围绕交互式堆垛纸箱机器视觉定位方法存在的泛化性不够高和交互不敏感等关键问题,从算法架构、数据集、训练方法三个方面展开研究,具体研究内容和结论如下:1)提出了模拟纸箱堆垛拆垛交互过程的交互式堆垛纸箱机器视觉定位算法。交互定位抓取方法结合智能装车卸车实际工况,将堆垛纸箱定位这种密集检测问题转化为高精度检测问题,更加充分利用了软硬件资源且降低了定位算法的检测难度。并基于此提出掩码模拟交互法,使用掩码覆盖已检测到的纸箱,在算法层面模拟了交互动作,完全脱离硬件参与,实现了软件层面的交互式堆垛纸箱视觉定位算法。2)提出了高效扩充数据集方法,提升了算法的泛化能力。基于卷积神经网络的目标检测算法需要十万级甚至百万级的数据集作为支撑,SCD数据集构建初期采用的人工采集方案存在着成本高、效率低等问题,本文提出的高效扩充数据集方法,面向智能装卸车移动机器人装卸货需求,搭建网络爬虫,通过广度优先的图片搜索方式,下载补充堆垛纸箱数据集,实现了SCD网络数据集的高效扩充,构建了SCD网络数据集训练预训练模型。3)提出模拟交互法和交互训练法,提升了交互式算法的掩码感知性和交互感知性。现有的训练集中图片不包含掩码信息,且现有训练方法只训练模型学习一张图片某个交互状态下的特征,导致交互式算法对掩码和交互不敏感。本文针对该问题从数据处理和训练方法两个角度出发,提出模拟交互法和交互训练法。在输入层后增加模拟交互层,随机在训练图片中选取目标并添加掩码信息,生成交互图片,且每一个小批量训练集中包含每张图片的原始输入图片和交互图片,使得交互式算法可以学习同一张图片不同交互状态下的特征。4)以SCD网络数据集训练预训练模型,并采用交互式堆垛纸箱机器视觉定位算法进行交互式训练,在智能装车卸车移动机器人实际工况下识别定位准确率达到工业级应用标准,为其达到工业级应用标准奠定了基础。
其他文献
量子纠缠操控的实现推动了量子信息技术的快速发展,不管是在量子通信还是量子计算领域,都广泛的应用了量子纠缠态,其潜在用途已在各种应用中得到了证明。目前的研究表明,利用光力相互作用可以在腔光力系统中实现光学模式和力学振动模式间的纠缠,同时也可以实现不同光学模式或者力学模式间的纠缠。这使得腔光力系统的研究受到越来越多的关注,由于可以制备具有多样性的量子纠缠态,腔光力系统将有望用于实际的量子信息和量子通讯
强磁场已成为现代科学领域越来越重要的极端实验条件之一。同时,随着大功率太赫兹源、核磁共振等前沿大科学实验的发展,人们对磁场稳定度、强度和持续时间的要求也越来越高,因此同时具有高场强、高稳定度特点的平顶脉冲强磁场技术被提出并得到深入研究。为了实现高稳定度的平顶脉冲磁场,一般采用高频补偿电源与大电流主电源结合的方式,补偿电源在主电源电流(磁场)达到平顶阶段后,对其进行补偿,提高纹波水平。但现有的平顶脉
目的:深静脉血栓形成(Deep venous thrombosis,DVT)是创伤性骨折患者中最常见的并发症。中性粒细胞胞外诱捕网(Neutrophil extracellular traps,NETs)除了发挥抗菌作用外,还具有促进血栓形成的作用。在这项前瞻性研究中,我们研究了NETs在创伤性骨折患者血栓形成中的作用,以及生物标志物NETs是否可用于辅助诊断患者的血栓形成风险。方法:本研究纳入自
随着5G技术的快速发展,微波介质陶瓷滤波器因其具有体积小、高Q值、高功率容量等优势,被大量用于5G基站,但是高性能的陶瓷介质滤波器离不开高性能的微波介质陶瓷材料。因此开发性能优异的微波介质材料变得尤为重要。本文以LaAlO3基微波介质陶瓷作为研究对象,通过传统固相法制备La1-xYxAl O3(x=0-0.2)和La Al1-x[Mg0.5Ti0.5]xO3(x=0-0.2)系列陶瓷,并通过XRD
电磁轨道炮采用全电的发射方式,借助电磁力加速物体至高速,其发射效率等于电能到动能的转化率。如何提升发射效率一直是电磁轨道发射技术的研究热点和发展瓶颈。高功率脉冲电源分布式储能、分时序触发的策略设计是提升电磁轨道发射系统效率的有效途径,但分布储能式电磁轨道炮的实物研制周期长、试验成本高,因此仿真建模成为评估其整体动态性能、研究效率提升方法的必由之路。首先,建立分布储能式电磁轨道发射系统的仿真计算模型
富氧燃烧技术被认为是最有潜力的CO2捕集技术之一,加压富氧燃烧技术由于具有发电效率高、污染物排放低等优势,被认为是一种更加高效清洁的二代富氧燃烧技术。受限于实现高温高压条件的实验台架搭建困难,目前对于煤颗粒在高升温速率、较宽压力范围内的燃烧特性实验研究相对较少。本文自主搭建了一套加压聚光光热快速升温实验台架,可以实现热解和燃烧过程中颗粒形态、温度、燃烧动态图像、产气信息等多参量实时测量。详细考察了
传统书院作为我国古代社会教育及思想文化传播的载体,见证了我国一千多年来的文化教育发展史。自唐代起,历代书院数量约达7000多所,然而流传至今书院越来越少,书院加速消亡的趋势也愈发明显。一直以来,学术界对书院的研究多集中在历史沿革、制度考察、形制解析、文化关联等方面,且成果丰硕,但对于传统书院遗产的保护与再利用问题尚待拓展。再者,对于传统书院遗产的价值缺乏系统认知,因此有必要从整体视角对其物质要素、
苯乙基间苯二酚(Phenylethyl resorcinol,PR)是一种高效美白活性成分,是高活性的酪氨酸酶抑制剂,能有效抑制黑素细胞中黑色素的合成。但是,PR的光、热稳定性差,易氧化变色,且溶解性差,难以透皮吸收,难以被黑素细胞摄取。纳米脂质体具有良好的细胞亲和性和生物相容性,可有效增加活性成分的稳定性,改善活性成分溶解性。人体皮肤及皮肤细胞呈负电性,将纳米脂质体进行修饰,制备成带正电荷的阳离
互联网技术的发展已逐渐改变了人们获取信息的方式,如何从非结构化文本信息中获取关键信息以构建知识图谱面临巨大的挑战。作为知识图谱的基础任务,命名体识别和关系抽取的目的在于从非结构化文本中分别抽取实体和实体之间的关系,从而为语义检索、知识问答、逻辑推理等下游任务提供重要的支持。本文在对实体关系联合抽取任务研究时发现,现有的联合抽取模型由于存在误差传播、信息冗余等问题,导致其很难有效地抽取出语句中的所有
【研究背景】阿尔兹海默症(Alzheimer’s Disease,AD,亦称老年性痴呆症)是全世界最常见的神经退行性疾病,主要表现为进行加重的、以记忆障碍为核心的认知功能损害和精神行为异常。其大脑皮质及海马等脑区的核心病理变化包括:细胞内tau蛋白过度磷酸化后聚集而成的双股螺旋细丝(Paired helical filaments,PHFs),进一步形成神经原纤维缠结(Neurofibrillar