【摘 要】
:
由于因特网和智能终端的普及,人们所面对的数据通常具有海量高维的特征,在大规模数据集里进行快速的相似性搜索有着很重要的应用价值。基于哈希的搜索算法可以把高维的数据映射
论文部分内容阅读
由于因特网和智能终端的普及,人们所面对的数据通常具有海量高维的特征,在大规模数据集里进行快速的相似性搜索有着很重要的应用价值。基于哈希的搜索算法可以把高维的数据映射到低维的二进制编码,在保留原始空间近邻关系的同时提高了计算效率,并且极大地减少了存储空间的占用,因而,基于哈希的相似性搜索技术已广泛应用于机器学习、计算机视觉和多媒体等领域。 本文提出了基于锚图哈希的半监督度量学习算法(Semi-supervised Metric Learning Based Anchor Graph Hashing,MLAGH),学习最优的距离度量以保留图片的语义和特征相似性,并在此基础上利用锚哈希技术把相似的图片映射成相似的二进制码元,以便于图片检索。具体学习过程包括:首先,在特征空间中构建图片的相似图,应用分簇算法在相似图中抽样出锚点,并获得样本和锚点的三元组关系。然后,利用样本和锚点的标记平滑性假设和三元组在特征空间中的距离限制构建目标函数,采用随机梯度下降法最小化目标函数以得到最优的距离度量。更进一步,引入惩罚因子减少随机梯度下降的迭代次数以减少算法的时间开销,提高算法的运行效率。最后,在两个公共的大规模图片数据集中进行图片检索实验,并和常用的哈希算法进行性能对比分析,从而验证了本文提出算法在检索的精度和时间开销方面的优越性。
其他文献
心脏是身体重要的器官,自从人类开始探测心电信号,心电图就成为了衡量及检测心脏是否健康的手段。心电学的研究和计算机的发展使心电信号的自动识别分类技术在近些年来一直在被
无线传感器网络(Wireless Sensor Network,WSN)中节点能量受限,因应用环境的限制难以补充能量,因此如何减少传感器节点工作时的能耗,改善节能效果、提高能量效率成为了无线传
网络仿真分析是一种对网络协议及其算法进行性能评估的技术手段。提供使用了P2P传输技术的视频点播服务是很有价值的。通过P2P传输技术,能够有效利用所有终端节点的带宽和计
随着现代信息技术的快速发展,社会各界对信息传输安全性的需求越来越强烈。包括人们日常使用的在线购物、网络金融在内的许多应用场景的实现,都需要有安全高效的身份认证技术
在无线传感器网络的相关应用中,节点的位置信息占有很重要地位。每一个节点在传送信息时,信息中通常包含位置信息,以增加信息的可用度。较容易取得位置信息的方法是手动设定
脉冲超宽带(IR-UWB)无线通信技术具有传输速率高、系统容量大、定位精度高、抗多径能力强等优点,已经成为短距离无线通信领域研究的热点。但是由于超宽带信号脉冲持续时间短,
无线AdHoc网络是由一组带有无线收发装置的移动节点组成的一个多跳的临时性自治系统。节点既是终端又是路由器,网络是基于所有参与节点都愿意为其他节点转发分组的假设下建立
高帧率、高分辨率视频在各种机器视觉领域应用广泛。军事上,如红外探测器、电光相机等侦察设备,要克服高速飞行和恶劣天气等因素,获取高帧率、高分辨率视频图像;公共交通安全
目前我国的移动通信市场正处于第二代(2G)和第三代(3G)系统过渡的阶段,尤其是具有我国自主知识产权的TD-SCDMA技术进入开发试用阶段,使的2G,3G多种通信制式同时存在的现象成
偏振复用正交相移键控(PM-QPSK)相干光通信系统不仅具有相干光接收技术的高灵敏度、长距离传输等特点,而且结合了偏振复用技术和多进制调制格式(正交相移键控),进一步提升了