基于机器学习的图像检索方法研究

被引量 : 8次 | 上传用户:godmouse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于图像作为多媒体信息中的最基本、应用最广泛的载体,图像检索一直是信息检索中相当活跃的研究课题。经过数十年的发展,基于内容的图像检索(Content Based Information Retrieval, CBIR)从出现发展至今受到广泛关注。但是,训练样本数量少、正样本和负样本的数量不对称及与用户交互的实时性要求一直制约着CBIR的发展。本文以相似性度量为切入点,提出一种结合短期学习和长期学习,将视觉相似性和语义相似性综合考虑的图像检索方法——RCAS (Real-time Classification in Asymmetric and Small data collection),在提高图像检索性能的同时为解决上述三个问题提供了一种解决方案。相似性度量一直是CBIR研究中最关键的部分之一,一些文献证明从相关反馈中学习相似性度量可以在一定程度上提高检索性能。RCAS算法首先从日志数据中学习语义相似性,然后以此为先验知识从标记样本和未标记样本中学习视觉相似性。同时,RCAS算法结合了机器学习中半监督学习和相关反馈算法的优点,对有关类和无关类中未标记样本采用不同的方式加以利用。并从未标记数据中随机抽取子集扩充负例样本集合,利用日志数据和相关反馈结果扩充正例样本集合。从而解决了小样本和不对称问题。RCAS还可以在与用户的相关反馈中及时地将检索结果返回给用户,满足了实时性要求。本文将RCAS与SVM-AL、Naive-AL和SSAIR三种算法在基于COREL的扩充数据库上,从前N个检索结果的准确率、PR图和反馈影响三组指标评价进行大规模对比实验。实验结果证明RCAS在各项评估参数上的表现都优于其他算法。最后,在本文提出算法和实验对比的基础上,开发了名为“Thinking&Mining"的基于内容的图像检索系统。此系统可以实现以图找图,并且可以方便的添加后续的改进算法。
其他文献
新疆杏资源十分丰富,但对其开发利用却极为有限,开发杏果汁饮料可以极大提高杏资源利用附加值。目前果汁饮料开发中存在的主要问题是果肉的悬浮稳定性和色泽稳定性。本文以新
随着经济的不断发展及人们生活水平的提高,人们对室内空气品质也越来越关注。传统方式的空调系统已经不能完全满足人们对于室内舒适度的要求,地板辐射供冷与置换通风技术已在
微生物诱导CaCO3沉淀(MICP)是将微生物学中生物矿化技术应用到土体加固过程中的一种方法,它具有低成本、环保等特点,国内外研究人员从不同角度对该技术开展了大量室内研究,分
本文对数字化X射线照相检测技术应用中关于计算机射线照相检测(CR)和直接数字化照相(DR)以及胶片扫描数字成像系统(FDR)的基本原理、应用以及设备做了较系统的介绍,有助于无
20世纪70年代以来,全球固定汇率制度的瓦解,全球商品价格、利率及汇率的剧烈变动,促使企业产生了避险的动机和需求。在科技进步的影响下,在金融市场放松监管的作用下,金融创
本科毕业设计是高等学校教学过程中一项重要的常规性教学工作 ,也是高校提高大学生综合素质和创新能力的一个重要的实践性教学环节。本文从多角度分析了影响当前高校本科毕业
随着中国邮政改革和发展不断的深入,邮政信息化水平逐步提高,作为涉及金融、物流和通信领域的国家企业,信息安全显得尤为重要。在四川地震之后,中国邮政集团公司将信息的异地
中国的领土争端问题由来已久,新中国成立之后,特别是20世纪60年代至今,中国政府在解决中国领土争端问题方面做了很大的努力,也取得了很大的成效。中国同周边国家在陆地边界的
在中国机械工业第六设计研究院项目:郑州市西绕城公路改建工程交通监控工程中,车流量检测是软件平台系统中的主要可扩展功能之一,同时车流量检测也是智能交通系统的关键技术之
<正>1931年9月18日,日本帝国主义悍然制造了震惊中外的“九·一八”事变。数日之间,辽宁、吉林沦陷,随后黑龙江沦陷,热河被围,日军铁蹄横行于白山黑水,所到之处生灵涂炭,血流