【摘 要】
:
21世纪,随着目前的硬件设备、大数据技术等不断发展,网络上除了存在一些专有的图像数据库,人们通过信息交流、电子商务等使得互联网上产生了各种各样的图像数据,而且每天都以十万计甚至是百万计的增长。计算机视觉中的图像检索就面临着如何为大规模的图像数据加上标签,如何方便且快捷地找到用户所需要的图片的问题。在基于内容的图像检索中,传统方法通常是人工为图像数据进行标注,人工标注过程会受到标注者的个人影响,造成
论文部分内容阅读
21世纪,随着目前的硬件设备、大数据技术等不断发展,网络上除了存在一些专有的图像数据库,人们通过信息交流、电子商务等使得互联网上产生了各种各样的图像数据,而且每天都以十万计甚至是百万计的增长。计算机视觉中的图像检索就面临着如何为大规模的图像数据加上标签,如何方便且快捷地找到用户所需要的图片的问题。在基于内容的图像检索中,传统方法通常是人工为图像数据进行标注,人工标注过程会受到标注者的个人影响,造成图片差异,而且工作量巨大。另外,在检索时通常是根据图片提取的特征进行逐一匹配检索,这种算法的不足在于提取的图片特征维度过高,在大规模图像数据库中,存储这些高维特征将耗费过多空间,检索的速度过慢。而近似最近邻中的哈希算法可以把高维空间中的数据经过哈希函数变换投影到汉明空间成为二进制码,从而达到降低数据维度,减少存储空间的目的,还可以通过汉明距离比较图片相似性以期提高图像检索的效率。另外,深度学习中的生成对抗网络通过训练后可以生成与真实图像相似的伪图像,可以认为它们具有同一标签,就可以用来指导无监督学习。但是,目前基于哈希的图像检索都需要多次训练产生哈希码,基于生成对抗网络的图像检索在解决语义鸿沟,理解图像视觉特征分布上还有较大研究空间,针对这些问题,本文主要工作如下:针对传统无监督哈希图像检索模型中存在图像数据之间的语义信息学习不足,以及哈希编码长度每换一次模型就需重新训练的问题,提出了一种用于大规模图像数据集检索的无监督搜索框架,即基于相关度距离的无监督并行哈希图像检索。首先,使用卷积神经网络学习图像的高维特征连续变量。然后,使用相关度距离衡量特征变量构建伪标签矩阵,并将哈希函数与深度学习结合。最后,在哈希码生成时使用并行方式逐步逼近原始视觉特征,达到一次训练生成多长度哈希码的目的。针对目前使用原始生成对抗模型训练不稳定,小尺寸单标签图像的语义学习不充分等问题,在深度哈希学习中引入注意力机制和生成对抗网络,设计了基于注意力机制和改进GAN的图像检索框架。即二进制注意力生成对抗图像检索模型。首先,构建一个编码器网络,通过加入注意力机制CBAM学习到图片最为关键的特征,然后,构建伪标签矩阵,同时通过哈希层生成哈希码输入到生成器,重建原始图像,最后,通过鉴别器对真假样本进行判别。在对抗学习过程中,提升生成的哈希码质量,从而提高图像检索的性能。为了验证所提出模型在图像检索领域的有效性,本文使用了两个常用的评价指标在公共数据集上进行相关对比实验,表明了模型确实在检索准确率和检索效果等方面有着突出表现。同时通过消融实验发现,本文提出的创新点都能一定程度解决前述问题。因此,本研究提出的图像检索算法与相关解决方案,为无监督大规模图像检索提供参考,具有一定的现实应用价值。
其他文献
各行各业的生产系统日益成为推动差异化和竞争优势的战略经营管理功能。因此,生产设备维护是整个生产系统管理功能的一个组成部分,应包括备件库存控制系统、全面质量保证和改进措施以及成本控制措施。本课题在了解加纳食品和饮料行业公司的生产流程的基础上,评估备件库存管理实践、生产质量控制实践和实施的维护管理策略,从而推荐一个维护优化模型系统,以确保最佳的运行成本和生产质量。本研究的实施主要采用归纳演绎法,具有探
目的:发热伴血小板减少综合征(SFTS)是一种由发热伴血小板减少综合征病毒(SFTSV)引起的流行性虫媒传播疾病,估计病死率高达6%至30%。该病在中国大陆,日本,韩国和美国均有报道。目前,还没有研究出针对SFTSV感染的特效药物和疫苗。考虑到SFTS的高死亡率和病情的快速进展,及时为SFTS患者提供治疗至关重要。因此,对于临床医生而言,如何精确预测那些更可能出现不良预后甚至死亡的SFTS病例非常
目的:肺癌是全球发病率和死亡率最高的恶性肿瘤,肺腺癌(Lung adenocarcinoma,LUAD)是肺癌的主要亚型。研究表明,葡萄糖转运蛋白1(Glucose transporter type 1,GLUT1)和血管内皮生长因子受体2(Vascular endothelial growth factor receptor 2,VEGFR2)在LUAD进展中起重要作用,但两个分子之间是否存在相
辐照加工技术被广泛应用于国民经济的各个领域,具有广阔的发展前景。在辐照加工技术中,绝缘芯变压器型电子辐照加速器因具有能量转化效率高、稳定可靠等特点,是中低能区辐照加工应用的优势机型。绝缘芯变压器型高压电源是该加速器的核心部分,其结构具有磁芯分段绝缘的特点,从而导致漏磁严重,使得各层次级线圈输出电压不均匀。为了解决该问题而引出的电压补偿方法是绝缘芯变压器型高压电源设计的关键技术之一。华中科技大学提出
配位聚合物(Coordination Polymers,CPs)作为一种新型的晶态材料,由金属中心与有机配体通过配位键自组装而成。CPs同时具备有机材料和无机材料的优点,具有结构和组分可调节性、多孔性,以及固有的杂化性质,在光、电、磁、催化等多个方面得到了广泛的研究。与其他电催化材料相比,CPs材料中有望得到高活性的氧还原(ORR)电催化剂从而替代贵金属Pt基材料。本论文选用富氮配体和羧酸配体作为
一直以来,中文分词都被当做是中文信息处理的第一站。而命名实体往往是句子最令人关注的成分,而中文分词任务的输出是作为命名实体任务的输入,因此如果通过相关算法的优化,可以提高中文分词的命名实体预测的速度和准确率,即提高了词法分析这个的运行速度以及它的准确率,那么就可以提高整个自然语言处理任务的性能,从而可以让计算机更好地理解中文,具有十分重要的研究意义。现在流行的开源分词工具有结巴、盘古、Ansj分词
氢气能量密度大,燃烧热值高,既没有“温室效应”,又没有污染,被誉为最具有发展潜力的清洁能源之一。天然气是重要的制氢原料,其主要成分为甲烷,甲烷制氢的方式有多种。甲烷蒸汽重整制氢技术因其发展成熟而受到广泛关注。本文以Latham(Latham DA,2009)的重整管为研究对象,利用Ansys Fluent软件建立了相应的甲烷蒸汽重整制氢数值计算模型并验证了模型的正确性。采用该模型研究了氢气的产量和
实施城市更新行动,是适应城市发展新形势、推动城市高质量发展的必然要求。目前,我国城镇化已转向高质量发展阶段,截至2020年底,常住人口城镇化率已达63.89%,一些东部沿海城市的常住人口城镇化率超过70%。根据城市发展规律,我国已经进入城市更新的重要时期,由大规模增量建设转为存量提质改造和增量结构调整并重,从"有没有"转向"好不好"。全国各地纷纷出台城市更新政策、机制,推动城市更新落地项目,
自大数据时代以来,信息量的爆炸式增长,给数据的存储和处理提出了巨大的挑战,不断促使人们寻求低成本、高可靠性的高速的存储方案。相变存储器因为在功耗、擦写速度和可靠性等方面的突出表现,被认为是最具有应用潜力的下一代存储器件。在为解决阻碍计算机性能提升的存储墙问题的两条解决途径3D堆叠和内存运算中,相变存储器都已得到应用。相变存储器利用相变材料在晶态和非晶态巨大的电阻差异来进行存储,其原理是用不同的脉冲
耳叶蝉亚科Ledrinae隶属半翅目Hemiptera头喙亚目Auchenorrhyncha叶蝉科Cicadellidae,是一个具有独特外形且较古老的叶蝉小类群,因其头部具有耳状突起的独特形态特征而得名。全世界共有5族40属300余种,中国共1族25属146余种。为了进一步了解耳叶蝉亚科的线粒体基因组的特征和各阶元系统发生关系,本研究对14属33种耳叶蝉亚科昆虫进行了线粒体基因组和核基因片段28