基于音频指纹的多媒体数据库重复检测技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:angel5tears
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在网络多媒体信息海量出现的今天,多媒体数据库中出现大量重复性数据,这不仅给多媒体数据库造成巨大的存储空间浪费,也使信息检索和查询变得困难。因此对多媒体数据重复检测技术的研究具有十分重要的意义,本文针对如何对大规模数据库进行多媒体数据重复检测展开研究,具体内容如下:(1)在检索方法方面,Philips算法虽然在多数信号畸变影响下具有良好的鲁棒性,但在实际高噪音环境下效果却不理想。MBM(Bit Mask)算法对Philips算法进行了改进,提高了其在实际高噪环境下的鲁棒性。然而MBM算法检索效率低下,而且鲁棒性和检索效率会随着数据库规模的扩大变的越来越差。本文结合两者的优缺点,提出了基于谐波滤波的音频指纹算法。实验结果表明该方法提取的音频指纹与Philips算法相比具有更好的抗噪鲁棒性,与MBM算法相比具有更高的检索效率。另外,通过采用多级检索方法进一步提高了检索的查准率。(2)在重复检测方面,针对大规模多媒体数据库的音频指纹数据量大,进行重复检测时面临内存不足、检测效率低下等问题,本文提出了分段内存加载方法。并基于该方法设计了重复检测算法,以及分剧集的多媒体文件重复检测方法。实验结果表明,本文提出的重复检测方法是有效的。(3)基于对音频指纹和重复检测方法的研究,本文设计并实现了基于音频指纹的多媒体数据库重复检测系统。该系统主要完成在多媒体文件加入数据库之前,进行多媒体文件的重复检测工作。针对网络平台下的大规模数据库重复检测问题,系统采用分布式结构,具有良好的可扩展性。实验证明,该系统能较好的完成重复检测功能。
其他文献
字符串匹配一直都是计算机科学的研究热点和难点。在信息安全领域中,关键字规模变大、互联网流量的增加,使得字符串匹配算法成为网络安全系统的性能瓶颈。本论文首先综述了三种
随着国民经济的持续发展,城市车辆饱有量越来越高,随之而来的交通拥堵问题也成为影响我们日常工作与生活的重要因素之一,寻找最优的交通解决方案成为人们关注的焦点。从研究所花
定性概率网是贝叶斯网络的一种定性抽象方式,表达的是节点之间的单调影响,即变量间增减的趋势,具有高效的推理机制。然而,有时我们并不关心定性概率网所表达的节点后验概率之
语音识别是一门内涵丰富、应用广泛的技术,在一些应用领域中正迅速成为一个关键的具有竞争力的技术,如用于自动口语翻译,实现跨语言交流。本文以汉语大词表连续语音识别为应用背
蛋白质复合体在各种细胞活动中都扮演了非常重要的角色。因此,如何有效地从蛋白质相互作用网络中预测蛋白质复合体成为生物信息学中一项重要的工作。蛋白质复合体具有高密度和
目前,越来越多的应用如几何重建、碰撞检测、混合现实、手势识别等,都依赖于对三维场景准确且快速的分析。通过基于图像的分析或者激光扫描技术来获取场景的深度图,其代价高昂且
移动Ad Hoc网络是由移动节点组成的无线移动通信网络,具有动态拓扑、无线通信的特点,与其它网络相比,Ad Hoc网络的独有特性带来了路由、节点协作、安全等一系列新问题,网络安
盲人是社会中需要被关注的弱势群体,盲人感知周围环境信息的手段有限,在陌生环境中很难获取到足够的环境信息。本文提出了基于蓝牙的盲人环境感知辅助方法,并开发了相应的原型系
随着社会的发展,互联网信息呈现爆炸式的增长,通过观察网民提交的文本发现,大多数网站特别是新闻和政府的网站,文本信息都具有结构化的特点,通常包含标题文本和正文文本。正
现今因特网的威胁中,僵尸网络是一种危害性极高,且感染数量逐年上升的重大威胁之一。使用者的计算机如果被植入僵尸病毒,攻击者即可从远程下指令给所有被植入僵尸病毒的僵尸计算