【摘 要】
:
随着人工智能技术的日益成熟,基于深度学习模型的文本分类技术被广泛的应用于现实任务中,例如情感分类、恶意文本检测、新闻分类等。但深度学习模型很容易受到对抗样本的攻击,这影响了模型可靠性,从而给使用相关技术的企业和个人带来了安全隐患。因此,如何在保证模型具有较好泛化性的同时提高模型对于对抗样本的鲁棒性,成为近几年深度学习领域亟需解决的重要问题。本文聚焦于深度学习文本分类任务,对影响模型可靠性的对抗样本
论文部分内容阅读
随着人工智能技术的日益成熟,基于深度学习模型的文本分类技术被广泛的应用于现实任务中,例如情感分类、恶意文本检测、新闻分类等。但深度学习模型很容易受到对抗样本的攻击,这影响了模型可靠性,从而给使用相关技术的企业和个人带来了安全隐患。因此,如何在保证模型具有较好泛化性的同时提高模型对于对抗样本的鲁棒性,成为近几年深度学习领域亟需解决的重要问题。本文聚焦于深度学习文本分类任务,对影响模型可靠性的对抗样本进行研究。从文本对抗样本的攻击和防御两方面,对现有方案展开分类分析;并针对对抗样本的生成、防御、实验评估三个环节,完成了以下三项工作:1)提出了一种基于单词显著性的文本对抗样本生成方案。研究对抗样本的生成技术,能帮助研究者更好的了解模型工作机理并改善模型性能。现有的大部分基于单词替换的文本对抗样本生成方案,存在替换词数过多、得到的对抗样本可读性差等问题。本文方案利用单词显著性准确定位到对分类结果影响较大的单词,并利用Hownet同义词语料库,得到词性和含义更相近的备选替换词,成功改善了以上问题。2)提出了一种基于混合对抗样本的对抗训练防御方案。对抗训练利用对抗样本对模型进行重训练,能很好的改善模型的鲁棒性。现有的大多数对抗训练防御方案,很难同时防御多种攻击方法。本文提出混合对抗训练方案,将多种攻击方法生成的对抗样本等比例混合之后对模型进行重训练,改善了模型同时防御多种攻击方法的性能。3)设计了一种文本对抗样本实验展示平台。近年来参与对抗样本研究的学者日益增多,但缺少一种可视化实验展示平台以帮助学者更直观、快速的了解对抗样本攻击、防御、评估的全过程。本文设计的平台,具有完备的攻击、防御、评估功能模块,同时具有较高的性能和较好的使用体验。基于以上三项工作,通过实验评估验证了前两种算法方案的可行性与优良性;通过测试分析验证了实验平台完备的功能与良好的性能。
其他文献
车辆雾计算(Vehicular Fog Computing,VFC)的快速发展为车辆带来了诸多益处,如对计算资源的低时延访问。然而,安全与隐私威胁、信息不完全及用户车辆任务数据排队时延和切换成本的长期约束等限制了其发展。本文基于区块链和智能合约提出了一个保护用户隐私、确保安全性和公平性的任务卸载方案。具体来说,用哈希树和智能合约实现“计算量证明”,进而减少“双重索偿”攻击、“搭便车”攻击和赖账攻击
随着无线技术的广泛应用,毫米波通信成为近年来研究的热点,信道测试、建模与仿真技术在毫米波通信系统设计中起到重要作用。与此同时,遗传算法(Genetic Algorithm,GA)与机器学习中支持向量机(Support Vector Machine,SVM)算法的结合能够克服高维数据处理复杂度高、冗余数据处理对算力要求高等传统信道研究难题。而灰色理论的引入可以使模型面向小样本数据,增加模型的预测精度
深度学习方法以其特征提取和非线性数据建模的优势,受到越来越多研究者的关注。卷积神经网络作为深度学习中一种典型的结构,被广泛应用于化工、生物和语音识别等领域。卷积神经网络局部连接、权重共享等特点,使其可以有效地降低网络的复杂度,减少训练参数的数量,增强模型的容错能力。近年来中国电力工业中新能源占比越来越高,正在逐步构建高比例新能源电力系统,因此风速的精准预测对风电并网下提高电力系统的稳定性有重要意义
近年来,经济持续快速发展,人民生活质量得到显著提升,消费需求也在持续扩大。乘用汽车作为人民出行重要的交通工具,市场需求量也在不断增长。乘用汽车消费需求的不断扩大驱动了汽车物流行业的进步。铁路运输作为汽车物流的运输方式之一也实现了快速发展。在发展的过程中,铁路运输的固有属性使其具备了长距离、大批量、可靠性强等优势。基于铁路的优势特征以及汽车物流的特殊性,铁路运输逐渐发展成为了乘用汽车物流的主要运输方
多机器人编队问题是多智能体协作研究的重要问题,是机器人控制的一个重要分支,也是当前研究的热点,机器人编队已经应用在军事搜索,潜艇编队,无人机编队等复杂任务中,通过多个机器人相互协作进行编队能够完成多种复杂的任务,能提高工作效率,减少能源消耗成本,提高任务完成的成功率。本文以轮式移动机器人为研究对象,采用领导者-跟随者编队的编队模式,通过用滑模变结构控制来对该非线性系统进行控制,对多机器人编队控制进
随着日常生活和生产过程中智能平台的广泛应用,越来越多的智能平台搭载云台相机作为其获取有效视觉信息的重要手段。为了充分发挥云台相机的优良特性,研究云台相机的位姿控制策略具有重要意义。本文针对云台相机位姿控制,研究基于传统PID方法结合群智能算法以及深度强化学习的相机位姿控制算法。论文的主要工作如下:首先,简介强化学习和深度强化学习的基本概念,对比分析了基于值函数、基于策略梯度和演员-评论家三种强化学
随着互联网技术的发展,互联网上的信息量每天都在爆发性的增长。如今云计算凭借其高可靠性、高可扩展性以及计费灵活等特点,在高效处理海量信息方面越来越受到人们的关注。云计算本质上是一种分布式计算,用户可以根据自已情况,随时随地按需获得服务。随着用户规模的不断扩大,云平台需要处理的任务也逐渐增多,因此当前研究的重点在于任务调度算法的设计和改进。蚁群算法(Ant Colony Optimization,AC
卷积神经网络在大量的传统机器学习任务上的表现超越传统方法,在实际生产生活中正得到广泛的运用,例如:图像分类、目标识别和生成模型等。然而,当前的先进网络往往具有较大的计算量,这限制了其在大量低成本、低功耗的边缘场景中的使用。同时,将面向复杂数据的模型直接应用到较小的数据集上,会不同程度地增加网络模型的冗余,甚至会因过拟合影响模型的泛化性能。网络压缩领域中的网络剪枝方法能以结构化的方式移除模型中的冗余
当前的工业过程控制系统中,线性控制器仍占绝大部分。然而真实的工业系统都是非线性的,工况切换,设备老化等等实际工业问题都对传统控制器带来挑战。研究更加智能的,具有自学习能力的控制算法具有重要意义。随着机器学习算法的不断发展,以深度学习、机器学习为基础的强化学习算法使得非线性系统自适应控制出现了新的研究方向。强化学习是具有自我决策能力的控制算法,通过探索与试错拥有类似人类的学习能力,通过学习不断改善自
在工业过程控制中,控制器的自整定被认为是一个提高控制系统自动化程度的有效方法。控制器自整定的一般过程就是通过激励信号获取系统输出数据,其次利用这些简单的采样数据获取系统重要的特征参数,最后利用这些特征参数快速获得控制器参数。目前ABB、Siemens、Honeywell等公司都已经将PID自整定技术用在了自己的产品中,效果不错。然而调查研究表明,PID虽在工业现场使用极其普遍,但效果也不一定总是很