【摘 要】
:
随着社会的发展和科技的进步,数字音频已经成为人们日常生活主流的信息载体。由于Cool Edit、Cakewalk以及Audition CS6等音频处理软件的广泛应用,人们肆意伪造或者篡改数字音频的行为也日渐增多。随着数字音频面临日益严重的信任危机,近年来国内外涌现出很多数字音频取证技术的研究。数字音频取证技术是通过解决数字音频的真实性、完整性以及原始性等安全问题,以达到保障数字音频安全性的目的。截
论文部分内容阅读
随着社会的发展和科技的进步,数字音频已经成为人们日常生活主流的信息载体。由于Cool Edit、Cakewalk以及Audition CS6等音频处理软件的广泛应用,人们肆意伪造或者篡改数字音频的行为也日渐增多。随着数字音频面临日益严重的信任危机,近年来国内外涌现出很多数字音频取证技术的研究。数字音频取证技术是通过解决数字音频的真实性、完整性以及原始性等安全问题,以达到保障数字音频安全性的目的。截至目前,数字音频取证技术已经得到了快速地发展,并且取得了较为丰硕的成果。然而值得注意是,已有的数字音频取证技术主要关注取证结果的准确性,往往忽略了取证方法本身的安全性和可靠性。假设非法分子在对音频进行篡改伪造之后,采取反取证技术来隐藏或消除篡改痕迹,那么已有的大部分取证技术都将可能失效。反取证技术能够从技术安全的角度去评估现有的取证方法,可以揭露取证方法中存在的潜在问题与缺陷,有利于现有取证技术的进一步发展与完善。相对于数字音频取证技术,目前针对数字音频反取证技术的研究还较少。本文以现有的数字音频取证技术为研究对象,针对数字音频的来源性与压缩历史取证两个方面进行反取证技术的研究和探索。具体的研究工作可分为以下三个方面:(一)针对音频来源识别与重压缩取证,本学位论文首先构建相应的取证样本库,并选择了三种典型的音频来源识别算法和三种典型的AMR重压缩检测算法,作为后续反取证研究的评估算法。在对上述六种算法进行原理剖析的基础上,我们使用构建的取证数据库对六种算法进行了复现和性能评估。(二)针对音频来源识别反取证,本学位论文首先研究了数字音频来源识别原理。在此基础上,我们使用生成对抗网络作为实施反取证操作的基本框架,并为来源识别算法设计了混淆攻击与误导攻击两种攻击策略。在生成模型与判别模型的对抗过程中,我们引入一个取证模型来对抗生成模型,将取证模型输出的损失反向传播给生成模型,以此推动生成模型获得反取证的效果。在损失函数的设计中,为了约束生成模型对输入音频的修改强度,本文设计了感知质量损失函数来保证受攻击后的音频不会被取证人员察觉。在模型训练中,我们通过使用大量的数据来训练生成器使得生成器能够学习到目标音频的统计分布,从而对音频进行有效地修改,以此达到攻击目的。实验结果表明,经过混淆攻击后的音频能够很好地躲避三种来源识别算法的检测,将他们的置信度从97%降低至了5%。而经过误导攻击的音频能够被三种识别算法以87.25%的概率误判成指定的设备类别。以上两种反取证音频的PESQ的平均值都处于3.4左右,攻击对造成的音质损失都在可接受范围内。(三)针对数字音频重压缩反取证,本学位论文通过分析两种重压缩检测场景,分别提出了基于生成对抗网络的反取证算法与基于优化方法的反取证算法。在场景一中,取证算法只接受AMR格式的音频作为检测样本,则经过反取证处理的音频需要经过AMR压缩成AMR格式提供给取证算法。我们使用生成对抗网络来实施对AMR压缩的逆变换过程。在训练中,我们通过数据驱动的方式训练生成器,使得生成器能够学习到二次压缩音频与原始音频之间的差异,在后续实验中能够提高二次压缩音频的音质,来抵消由于经过AMR压缩过程所造成的失真影响。实验结果表明,二次压缩音频在经过生成器修改继而压缩成AMR再解压后得到的音频,能够具有与一次压缩音频相接近的音质,平均PESQ评分在3.2左右。而且我们的反取证音频能够以95.42%的概率很好地躲避AMR重压缩取证方法的检测。在场景二中,取证算法只接受WAV格式音频,则我们只需要提供给取证算法WAV格式的待检测音频。我们使用两种优化方法(快速梯度下降法与基于显著图攻击方法),通过尽可能少地对音频采样点的值进行改动,使得将二次压缩音频的统计分布特征与一次压缩音频相似。实验结果表明,优化方法可以在保持音频质量基本不变的情况下(PESQ评分保持在4.2),使得取证方法基本失效,而且对于选取的三种检测方法的成功攻击率都保持在94%以上。
其他文献
人们对于更大的硬盘驱动器的存储容量的日益增长的需求,推动了人们对这方面的关注和广泛的研究。在上个世纪末研究者发现了巨磁阻(GMR)效应,几年后就研究得到基于氧化铝的磁性隧道结(MTJ)。MTJ是一种不同于其它类型的磁性存储器,它是自旋电子学领域的有研究前景的纳米结构器件。MTJ具有很高的隧道磁阻(TMR)效应,体现在存储容量、速度和稳定性方面有很大的优势,另外由于是纳米器件,它的尺寸会比之前的存储
随着社交网络的快速发展以及用户的广泛参与,网络中产生了日均千万级的文本数据,其中包含了大量公众对热点事件的观点与态度,以及用户对产品的体验等。对这些含有丰富情绪信息的文本数据进行挖掘与分析,识别、理解其中包含的情绪信息,具有很高的社会价值与商业价值,引起了学术界和产业界众多研究者的广泛关注。网络文本具有口语化和不规范化的特点,这使得情绪分析工作面临很多挑战。在词嵌入表示方面,现有模型大多采用Wor
随着计算机视觉的迅速发展,3D成像技术在工业检测、医疗卫生、安全防护、虚拟现实和3D打印等领域得到了广泛的应用。本文研究的3D成像装置,以小柱状芯块为目标,实现对其外观质量的检测。3D成像装置采用纯色LED线结构光与面阵相机相结合的方式,对芯块的外观进行扫描。通过设计双滚筒机械装置,带动芯块旋转,从而实现对周面的结构光图像进行采集。通过设计电动滑台装置,带动芯块定向匀速移动,采集芯块端面的结构光图
复合材料作为一种新兴材料,凭借其强度高、重量轻、隔热性好等优良性能,近年来被广泛应用于工业生产的各个领域。但其在加工制造及使用时,可能会产生脱粘、孔隙等缺陷问题。这些问题会使复合材料性能快速下降,最终影响材料的可靠性。尽管破坏性试验检测法可以较好地完成材料的质量检测,但其破坏了材料的结构,因而只能抽样检测,无法实现在线实时检测。因此,应用先进的无损检测技术实现对材料缺陷的检测与判定,具有重要的现实
姿态作为重要的导航参数,随着智能驾驶、无人机和无人车等技术的兴起,得到了越来越多的重视。在基于不同传感器的测姿技术中,GNSS测姿具有全天候、精度高和误差不随时间累积的优势,但在挑战环境下,测姿精度、连续性和可靠性会迅速降低。MEMS惯性(简称MEMS)测姿则具有低成本、体积小,自主无源的优点,将GNSS与MEMS两者进行信息融合可实现优势互补,获得更好的测姿结果。根据GNSS天线的数量,GNSS
数字隐写技术是保障通信安全的重要手段,但也为恶意的非法通信提供了便利。隐写分析技术作为隐写术的对抗手段,其目的是检测信号中是否嵌有秘密信息,在这个注重信息安全的时代具有重要的研究意义。数字音频是人们生活中常用的数字媒体之一。音频应用与音频处理软件的普及极大地促进了音频隐写和隐写分析技术的发展。在复杂的大数据取证场景下,音频数据通常具有多样性和复杂性,攻击者使用的载体数据模型和隐写算法通常是未知的,
特征匹配作为计算机技术和人工智能中一项基本的图像处理技术,在许多计算机视觉应用中都扮演着关键的角色,比如图像检索、图像配准、三维重建等。随着计算机技术和人工智能在人类日常生活中日益广泛的应用,人类对特征匹配技术的有效性、稳定性和泛化能力都有着更加迫切的要求。在特征匹配过程中,如何确定两个特征属于同一目标是非常困难的,特别是在匹配特征在外观上非常不相似,而非匹配特征又特别相似的情况下。因此,设计一个
随着地球人口膨胀、陆地资源短缺、生态环境恶化等情况的加剧,人类逐渐将目光聚焦于占地球表面积71%的海洋。水下图像在海洋生物研究、海底资源勘探、海洋军事应用和水下考古等领域起着关键作用,具有重要的研究价值。水下图像相比声学图像具有更加丰富的细节和色彩信息,在水下科考和工程实践中具有不可替代的地位。高质量的水下图像既满足了人们的视觉感知需求,又有助于高层视觉的应用。然而,由于水下成像环境的独特性和复杂
随着人们日常生活水平的提升与人工智能技术的迅速发展,越来越多的智能家居系统、人工智能机器人等高科技产品进入人们的生活中。手势交互作为指令下达最为简洁、便利的人机交互方式之一,一直是计算机领域的研究热点。相较于穿戴比较繁琐且设备价格高昂的穿戴式手势识别技术,基于视频信息的动态手势识别技术则更为大众所接受。近年来,深度神经网络以强大的特征提取能力以及模型泛化能力在手势识别领域取得了较好的成绩。本文深入
在有机光伏材料中,单线态分裂是一种在特定有机分子中发生的激发倍增现象,即分子吸收一个光子可以产生两个电子空穴对。作为一种多激子效应,单线态分裂可以有效地避免能量损失,提高太阳能电池的光电转换效率。近年来,随着超短激光脉冲和时间分辨技术的出现和发展,科研工作者们对单线态分裂的研究不断深入,然而其物理实质还有待进一步揭示。红荧烯作为常见的单线态分裂材料,其单晶、多晶、薄膜的单线态分裂研究层出不穷,但是