【摘 要】
:
在大数据环境下,图像数据与日俱增,提供一种快速相似性检索和紧凑存储的算法变得至关重要。哈希算法由于具有较高的检索效率与较低的计算成本,已被成功地应用在大规模图像检
论文部分内容阅读
在大数据环境下,图像数据与日俱增,提供一种快速相似性检索和紧凑存储的算法变得至关重要。哈希算法由于具有较高的检索效率与较低的计算成本,已被成功地应用在大规模图像检索领域中。大多数现有的哈希算法都假设用于图像检索的数据库固定不变,而实际的数据环境通常是动态变化的。因此,静态的哈希算法往往难以适应动态数据的变化,导致其图像检索能力的不断下降。在动态环境下,添加到数据库中的新图像可能与之前数据库的数据分布大不相同,导致数据库的数据分布发生改变,即出现概念漂移问题。目前已有少量在线哈希算法被提出,以适应动态数据的变化。但是,这些算法依然假设新出现的数据服从某种固定分布,没有考虑到动态数据环境中发生概念漂移的场景。增量哈希算法(ICH)是一种针对动态数据环境中发生概念漂移问题的有效图像检索方法。其思想是通过最新一批数据训练新的哈希表,根据最新数据对多个哈希表进行加权来动态更新哈希表权重,以适应数据环境的变化。但是,ICH算法使用最新数据中的所有图像来训练新的哈希表可能造成不必要的浪费,因为新出现数据中并不是所有数据都是对新哈希表训练有用的,甚至可能有部分数据重复。本文针对目前动态哈希算法所存在的不足,从不同的角度提出了两种基于样本选择的增量哈希算法,以更有效地处理动态数据环境下的图像检索问题。本文所提出算法的主要思想是从新旧图像数据集中为每个类别选择出具有数据库分布信息的代表性样本来训练新的哈希函数,使用多个哈希表来保留不同时刻图像之间的相似度信息,并根据最新的动态数据环境自适应地更新哈希表及其相应的权重。对于查询图像,通过对多个哈希表的图像检索结果进行加权重排序来呈现检索结果。通过三个真实图像数据集模拟出多种不同的动态数据场景,实验结果表明本文提出的两种算法在动态数据环境的图像检索能力均优于主流的哈希算法。
其他文献
《2030年可持续发展议程》提议各国要践行绿色创新理念,实现社会、经济和环境的可持续发展。作为我国的核心产业,制造业的绿色创新转型对于我国可持续发展具有重要意义。人类
在现实世界里,存在许多计算复杂度高、计算时间长的复杂问题。对于此类问题,算法优化过程的计算成本是一个备受关注的领域。优化中,部分问题可以使用低成本的代理模型进行替
深度学习随着计算设备的发展在近期获得了广泛的关注,其高效性与高准确性在一定程度上超越了以往的传统算法。然而,深度学习的不可解释性使得其在医疗、军事、金融等对于可靠
资产证券化将流动性较差但能产生稳定现金流的贷款打包起来,通过结构性重组,转化为可以在金融市场上出售和流通的证券,是银行转移信用风险的重要手段。但实际开展过程中,资产证券化改变了银行与借款者、银行与其他金融机构的关系,进而对银行经营稳定性产生影响。这一问题在2008年金融危机中尤其凸显出来。资产证券化对银行行为的影响主要表现在:一方面,证券化提高银行资产流动性,降低在危机状况时将资产变现的成本,从而
立体匹配是计算机视觉任务中的一个重要分支,其任务是计算双目图像中对应像素的视差。立体匹配算法在机器人、自动驾驶等领域有着非常广泛的应用前景。随着卷积神经网络融入,
极端降水是广泛分布于全球、具有极强破坏性的自然灾害之一。在全球变暖的背景下,极端降水事件趋强趋多,对人类社会的影响进一步扩大。因此,研究极端降水的时空变化特征和可
齿轮作为工业重要传动零件且广泛应用,其加工方法也较为复杂。因其复杂工艺在大批量生产中需要进行特制夹具进行完成。那么调整夹具的找正样件精度显得尤为关键。当标准齿轮
在环境保护和能源消费结构升级,供给侧改革的双重背景下,以天然气为代表的清洁能源越来越成为能源领域发展的重点。作为主要的天然气应用领域,天然气工业燃料领域承载着极大
近年来,基于卷积神经网络(CNN)的方法在图像检测和识别领域取得了巨大的成功。随着交通采集技术的日益发展,采集设备每时每刻都会产生海量的交通图片数据。如何从这些海量的
改革开放初期实行的家庭联产承包责任制,大大调动了农民的积极性,使农民温饱问题得到解决,农村改革获得了极大成果。但伴随着农村改革的继续深入,社会的不断发展,家庭联产承