论文部分内容阅读
近年来,互联网技术、多媒体处理技术发展迅猛,多媒体数据在信息交流、信息存储等方面中发挥了越来越重要的作用。而语音作为最便捷的多媒体信息,在人类交流、沟通中的作用尤为重要。随着计算机存储技术的进步,特别是云存储技术的发展,语音数据储量也飞速增加。网络平台拥有庞大的用户量,在其中,语音信息用途多样,使用也很频繁,而如何在保证隐私数据安全的前提下更高效地处理大规模语音信息成为急需解决的问题。本文研究了适合大规模语音处理的语音感知哈希技术及其在密文语音检索中的应用,主要研究工作如下:(1)现有的语音感知哈希算法所提取的摘要序列,没有区分权重,导致大规模应用时效率较低。鉴于此,本文提出一种基于时域、频域趋势变化的语音感知哈希方案。该方案将语音分为时域和频域两部分提取特征,时域特征选取语音的短时能量变化情况,频域特征选取语音的Bark域能量变化情况。使用该算法生成的感知哈希序列,匹配时先匹配时域感知哈希序列,再匹配频域感知哈希序列,若两组匹配结果都成功,则判定匹配成功,若时域感知哈希匹配失败,则不匹配频域感知哈希,直接判定匹配失败。这样,在应用于大规模语音处理时,可大大提高感知哈希的匹配速度。实验仿真结果表明,该算法在效率提升的情况下,依然具有很好的区分性,对常用的内容保持操作有很强的鲁棒性。(2)语音中不乏语音订单、法庭证据、军事机密等重要的信息,如果将这些重要语音信息不加保护的上传云端,很容易造成信息泄露。而前端加密是保障云环境中数据安全的有效方法。加密数据规模的不断增大,给快速、准确的检索带来了很大的困难。本文为解决这一难题,利用语音感知哈希算法,设计了一种密文语音检索方案,采用特定的加密算法对语音进行加密,再将语音生成的感知哈希序列作为数字水印嵌入到加密后的语音中。在检索时无需解密,只需进行感知哈希序列匹配,就可以实现在不解密、不下载的情况下,对云端的大规模密文语音进行快速、准确检索的目的。实验结果显示,该方案获得了很好的查全率和查准率。