【摘 要】
:
目标检测是从静态图像或者动态视频中提取出底层的图像特征并进行编码组合后,通过机器学习的方法,得到对原始图像或者视频的目标检测结果。作为从浅层图像处理到深层图像理解
论文部分内容阅读
目标检测是从静态图像或者动态视频中提取出底层的图像特征并进行编码组合后,通过机器学习的方法,得到对原始图像或者视频的目标检测结果。作为从浅层图像处理到深层图像理解之间的关键环节,目标检测技术已经发展成为计算机智能领域的一个重要研究方向,并被广泛应用到人们生产生活的方方面面。比如,工业生产领域里基于机器视觉的装配机器人、军事应用领域里的遥感航拍图像处理、智能交通领域的监控录像设备以及生活娱乐领域的指纹解码、相机自动对焦等等。这些目标检测技术的应用不仅为现代化经济、国防、科技的发展奠定了基础,也在很大程度上提高了人们的生活质量。目前,目标检测技术还有很大的进步空间,比如如何在不影响检测效果的同时降低机器学习阶段的训练成本、如何丰富目标检测结果的可视化表达以及如何提高在非平衡数据下目标学习和检测的效果等问题。针对以上目标检测技术中遇到的问题,本文基于ESVM集成模型(Ensemble of Exemplar-SVMs)以及ELDA(Exemplar-LDA)目标检测模型,融合多实例学习机制(Multiple Instance Learning),提出了基于ELDA集成的多实例目标检测模型,并获得了较好的检测性能。本文模型首先针对各个范例(exemplar)中提取的HOG(Histogram of Oriented Gradient)特征,用较少的训练成本得到各个范例对应的独一无二的单范例LDA(Linear Discriminant Analysis)分类器。根据验证集图像上的检测结果,构建关联矩阵和共生矩阵对单范例分类器进行集成,以调节检测窗口的打分。接着,本文模型在验证集图像和负样本集图像的检测结果上构建第二层正、负样本包,运用多实例学习算法进行训练,准确找到样本包中每一个样本的正、负标签,构建出单类别mi-SVM分类器。运用单类别分类器对集成的单范例分类器在测试集上的检测结果进行过滤,进一步提高目标检测的准确率,降低误检率。更重要的是,模型可以直接在检测结果上做元数据(分割效果、几何形状等)替换,进而表达出更准确更丰富的目标属性。本文提出的基于ELDA集成的多实例目标检测模型,以MATLAB和C++混合编程实现,对PASCAL VOC 2007数据库上的火车、小汽车、沙发三类物体做了目标检测和性能分析实验。实验结果表明,相较于原始的ESVM集成模型,本文提出的模型在火车、小汽车、沙发上的平均准确率分别提高了7.6%、26.4%和25.2%,降低了单范例分类器训练过程中负样本挖掘的训练成本,同时也丰富了范例对检测结果的智能化表达。
其他文献
我国可转债市场正处于新兴繁荣阶段,越来越多的企业利用可转债进行融资。可转债特殊之处除了“上不封顶,下有保底”的优点外,还可以使得投资者行使转股权,可转债的这些优点吸引了越来越多的投资者。但是由于目前大部分投资者对可转债价值缺乏清晰彻底的认识,不合理的转股行为时有发生。非理性转股会对股价产生不利影响,因此对可转债转股产生的股价影响展开研究对于发行公司价值研究、可转债投资者财富管理以及促进金融市场的稳
伴随着通信技术的发展,广播网络同样在经历着变革与更新。下一代广播网络将具有超高清广播、鲁棒性传输和支持交互性业务的特点。为了更好地满足用户的需求,美国ATSC3.0(Adva
随着经济全球化和信息技术日益向纵深方向发展,软件开发团队面临着愈演愈烈的竞争环境。目前大部分的软件开发团队正面临着开发效率不能完全应对高速发展的需求的困难。频繁的变动需求导致软件开发团队成本增加,同时也造成在软件开发的过程中无法及时、灵活的对需求变动作出回应等问题。软件开发团队获得竞争优势的关键就是如何快速响应变化、提升应对效率。这时,提升软件开发团队敏捷性成为团队顺利完成开发、提升竞争力的核心之
基于2000—2009年工业企业数据库和海关贸易数据库,借鉴De Loecker(2012)的模型对企业加成率及可变生产率进行估计。在此基础上,检验了国际化经营的两种主要方式与企业成本加成率之间的关系,以分析其要素楔子扭曲效应;而后以企业成本加成率的离散度作为衡量资源配置扭曲的指标,并就出口与对外直接投资这两者对资源配置溢价的影响进行检验,以分析其效率楔子扭曲效应。本文进一步分析了异质性企业间影响
随着能源危机和环保形势的日益严峻,寻找可再生能源的新能源汽车成为迫在眉睫的一项任务。混合动力汽车(Hybrid Electric Vehicle,HEV)的多种能量源各自有不同特性,因此对于能量的管理成为混合动力汽车的核心问题。混合动力汽车集合了电气、机械系统,其中还有化学变化和热力学过程参与,很难使用数学模型进行精确地描述。本文针对并联式混合动力汽车能量管理策略存在的问题提出了优化方案,结合模糊
为加强进出口纺织原料的质量安全管理,山东检验检疫技术中心需要从媒体、论坛、博客、微博等网站里获取进出口纺织原料质量安全信息,并对信息进行统计、剖析、评估和上报。论文针对进出口纺织原料的质量安全管理工作的实际需求,分析、设计并实现“进出口纺织原料自动文摘系统”,主要的研究工作如下:(1)针对现有中文分词算法中歧义切分正确率低的问题,提出了一种新的分词算法—TD-MD算法,该算法将基于统计的互信息与t
近年来,数据挖掘技术迅速发展,半监督学习成为模式识别和机器学习领域研究的重点问题。监督学习算法依靠大量有标签数据进行学习,但在很多场景中有标签数据获取十分困难,进而无法保证算法的泛化能力。而半监督学习通过少量标签数据,能够完成对大量无标签数据的归类划分,这一特点使得半监督学习拥有更广泛的适用场景。粗糙集理论是用来处理各种不完全、不精确及不确定数据的一种数据分析方法。粗糙集可以通过样本间不可分辨关系
无线组网技术使联网设备摆脱了线缆的束缚,从根本上改变了人们访问因特网的方式。无线局域网(WLAN)是一种广泛使用的低成本无线组网技术。相较于蜂窝网络等其他组网技术,WLAN还具有高带宽,低时延和高稳定的特点。大量由个人部署的WLAN使得这项技术成为了应用最为广泛的无线组网技术之一。而伴随着这些优点的是覆盖范围较小的不足,个人部署的WLAN只能在有限的范围内使用。超出自己能够部署WLAN的覆盖范围的
德马格的纸卷发货仓库系统自从20世纪末期进入中国后,在短短的几年时间内,迅速覆盖了全国多个大型造纸厂,如玖龙纸业,晨鸣纸业,吉安纸业,太阳纸业等等。由此,德马格自动行车
近年来,汉语教学逐步走入国外的课堂。笔者根据在泰国圣保罗廊开学校汉语教学的真实经历,以该校教师及学习汉语的中小学生为研究对象,以问卷调查、课堂观察等具体方法,调查了该校的基本情况及学生的汉语学习情况,并从学生、学校师资、汉语教材、汉语课程设置及课堂教学等方面对泰国圣保罗廊开学校的汉语教学现状进行分析。通过调查得知,泰国圣保罗廊开学校在汉语教学方面存在学生学习动机不明确、师资短缺、教材短缺等问题。针