【摘 要】
:
随着软件的发展,软件的安全问题已经受到了工业界的关注和担忧。软件验证正是其中一种可以检查软件安全的方法。近年来,由于对软件安全需求的迫切性,大量的软件验证算法被研究人员提出,用来验证软件是否满足相关性质。可惜的是,由于软件验证算法的复杂,又缺乏统一的度量标准来提供给软件安全从业者选择合适的验证算法。如何为软件安全从业者提供合适的验证算法成为了软件验证领域迫切解决的问题。软件验证算法的自动化推荐成为
论文部分内容阅读
随着软件的发展,软件的安全问题已经受到了工业界的关注和担忧。软件验证正是其中一种可以检查软件安全的方法。近年来,由于对软件安全需求的迫切性,大量的软件验证算法被研究人员提出,用来验证软件是否满足相关性质。可惜的是,由于软件验证算法的复杂,又缺乏统一的度量标准来提供给软件安全从业者选择合适的验证算法。如何为软件安全从业者提供合适的验证算法成为了软件验证领域迫切解决的问题。软件验证算法的自动化推荐成为了解决上述问题的关键技术。目前的软件验证算法自动推荐技术都是基于机器学习算法的分类模型。旨在通过机器学习算法去学习到软件验证任务与软件验证算法之间的对应规律,从而形成一个能预测出给定验证任务和特定验证算法是否合适的推荐模型。然而,这些推荐模型都存在着软件特征提取困难、数据分布不平衡等问题。在本文中,我们提出基于LSTM和区域分类的验证算法推荐模型。首先,面对软件特征提取的困难,我们通过基于程序控制流图(Control Flow Graph,CFG)和word2vec来形成代码单词的嵌入向量。然后使用长短期记忆网络(Long Short Term Memory,LSTM)来学习代码的上下文信息,形成一个基于LSTM的验证算法推荐模型。其次,为了解决数据集类别不平衡的问题,提出了基于代码的样本增强的方法来提高基于LSTM的算法推荐模型在样本数量少的类上的准确率。在本文中,我们提供了两种基于代码的样本增强的方法,特别是提出了代码对抗样本的方法来增强样本。此外,本文还研究了基于LSTM的验证算法推荐模型针对代码对抗样本的防御,提出了基于语句重要度的区域分类防御方法。最后,通过三个实验分别验证了(1)基于LSTM的验证算法推荐模型优于现有的软件算法推荐技术。(2)基于代码的样本增强的方法能帮助基于LSTM的推荐模型提高在少数类上的准确率。(3)基于语句重要度的区域分类能有效减轻代码对抗样本的攻击。本文的主要贡献如下:·本文提出了基于控制流图和word2vec的软件代码特征提取方法。通过把软件代码看成是英文文本,用word2vec去获取代码文本中词的嵌入向量。最后,用这些单词的嵌入向量构建了代码的特征向量。基于控制流图和word2vec的代码特征提取方法是首次应用在软件验证算法自动化推荐技术研究中。·提出了基于代码对抗样本的数据增强方法。即通过生成代码对抗样本的方法来增强数据集数据。这种方法启发于文本的对抗训练。在本文工作中,基于代码对抗样本的数据增强方法是对抗训练在软件验证算法自动化推荐模型中的一次尝试。·提出了基于语句重要度的区域分类算法来增强基于LSTM模型的鲁棒性。与之前的区域分类不同的是,我们的采样方法是有方向的。在特定的语句对应向量空间上进行区域采样。基于语句重要性的区域分类算法是区域分类在代码文本上的扩展,同时也对其他的文本任务的防御也具有借鉴意义。
其他文献
目的探究乌灵胶囊结合长春胺缓释胶囊对突发性耳聋患者疗效、生活质量影响。方法研究纳入门诊收治的93例突发性耳聋患者(2020年2月~2021年5月收治),采取随机数字表法将患者分成观察组(46例)与对照组(47例),对照组患者采取服用长春胺缓释胶囊治疗,观察组患者长春胺缓释胶囊+乌灵胶囊治疗,比较各组患者临床疗效、治疗前后症状积分(耳鸣、耳闷、眩晕)变化、纯音听阈值变化及血清可溶性血管细胞黏附分子-
与目前已经商业化的层状LiCoO2,橄榄石型LiFePO4,尖晶石型Li Mn2O4等正极材料相比,富镍系正极材料LiNi1-xMxO2(M=Co,Mn,Al,x≤0.4)因其具有更高的比能量,被认为在电动汽车能量储存领域具有非常广阔的应用前景。然而富镍三元正极材料随着镍含量的增加导致材料在充放电过程中表现出循环稳定性差等致命缺点,如今有一个非常重要挑战就是在保持高能量密度的同时提高材料的循环稳定
为了探究天津港油品物流系统安全的基本事件及危险要素影响程度,引入运筹学中层次分析法对各危险要素作出分析评价。最后通过实例分析,找出了导致天津港油品物流危险事故危险性最大的因素集主要为自然灾害、周边高危活动和管理缺陷等。研究成果对于港口油品安全事故预防以及后期应急处置过程中突发安全事故管理故具有参考价值。
艾滋病皮肤瘙痒是人类免疫缺陷病毒(human immunodeficiency virus,HIV)/获得性免疫缺陷综合征(acquired immuno deficiency syndrome,AIDS)最常见的伴发疾病之一。西医学认为本病为多个疾病的综合症状,多与感染HIV后免疫系统紊乱,导致过敏性及免疫性皮肤疾病有关,治疗多以抗组胺药物、糖皮质激素及相关对症治疗为主。针对其本虚标实的病机本质
研究目的:探寻脑卒中并发脑心综合征相关的危险因素,并构建脑心综合征风险预测模型,为临床筛选脑心综合征高危人群提供评估工具。研究方法:(1)回顾性建模:收集2018年6月至12月国内4家三级甲等医院318例脑卒中患者病历资料进行回顾性分析及建模。根据患者是否发生脑心综合征分为脑心综合征组和非脑心综合征组,采用logistic回归进行危险因素分析,构建风险预测模型、简易风险评估量表。(2)前瞻性验证:
国有农用地基准地价评估是扩大国有土地有偿使用范围、推动国有农用地规范有序流转、建立城乡统一的土地市场的重要环节。国有农用地作为我国土地的一种特殊形态,具有与集体农用地不同的土地特点,目前我国尚未出台针对国有农用地基准地价评估的技术规程。由于国有农用地的特殊性,常用估价方法在国有农用地基准地价评估中存在一定问题,基于此,本文以茂南区国有农用地基准地价评估为例进行国有农用地价格评估和实践研究。本论文研
改革开放以来,在经济快速发展的同时,我国的城市化进程明显加快,基础设施建设逐步完善。近年来,随着城市轨道交通基础设施建设的稳步推进,城市轨道交通路网的不断扩大,城市轨道交通项目的正外部效应不断增大,对城市经济发展起到了重要作用,推进了城市化发展。PPP(公私合作)模式由于其具有振兴市场资本,释放市场经济活力,缓解政府部门财政压力的特点,被广泛应用于城市轨道交通基础设施建设。然而,在城市轨道交通基础
在对科学和工程问题进行数学建模时,时变非线性方程组越来越受到科学家和工程师的关注和青睐,它通常被应用于机器人学、机械手的运动控制、混沌系统和多维谱估计等多个领域。因此,求解时变非线性方程组在科学和工程中起着至关重要的作用.然而在求解过程中,时变非线性方程组与时不变非线性方程组一样,也会受到奇异问题的考验.本文主要以零化神经网络(ZNN)求解时变非线性方程组的方法为基础,结合时不变方程组和微分方程组
大数据、人工智能及云计算、边缘计算等技术正在向嵌入式方向发展,并且在物联网(Internet of Things,Io T)和工业物联网(Industrial Internet of Things,IIo T)中,嵌入式系统已经有大量的应用。这对于嵌入式系统的存储器提出了更多的要求,未来嵌入式系统应满足更高的时间和能耗的要求。磁畴壁存储器(Domain Wall Memory,DWM)具有低访问延
针对快递运输市场中高铁与航空的竞合问题,构建高铁与航空快递运输竞合Lotka-Volterra模型,以京沪OD为例分析两者竞合关系、发展趋势以及演化趋势,为高铁与航空快递运输发展策略研究提供参考。结果表明:2014—2022年高铁快递与航空快递年均增长率分别为0.263 41,0.241 90,均呈增速发展;高铁发展现状对高铁快递发展的影响系数为-0.000 99,表现为促进作用,航空发展现状对航