基于深度学习的二进制程序漏洞分析与检测方法研究

来源 :北京交通大学 | 被引量 : 10次 | 上传用户:lostbridge
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件系统的数量和种类不断增多,而软件漏洞无法完全避免。软件漏洞的数量也逐年提升,及时检测出软件存在的缺陷以免被不法分子利用也变得越来越重要。大多数情况下,研究人员无法获取软件程序的源代码,只能获取对应的二进制程序文件。因此,研究二进制程序的漏洞检测具有重要的实际意义。目前应用较广、效果最好的二进制漏洞检测技术为模糊测试,但是模糊测试技术需要对程序进行多次运行,消耗资源多,效率低。近年来,随着大数据以及人工智能等技术的发展,基于传统机器学习方法的漏洞检测技术取得了一定的进展。本文基于相关工作,同时参考深度学习在文本分类上的研究成果,提出了一种利用深度学习技术进行二进制漏洞检测的方法。与此同时,本文设计构建了卷积神经网络模型、长短期记忆网络模型、双向长短期记忆网络模型和卷积神经网络—长短期记忆网络模型四个漏洞检测模型。为了测试深度学习漏洞检测模型的性能,利用了 VDiscover工具提取的数据,即32位Linux系统中的二进制程序运行过程中的函数调用序列及其最终运行状态,并以模糊测试工具zuff的测试结果作为标签,对深度学习漏洞检测模型进行训练。在实验中,本文首先通过使用word2vec方法将文本数据转化为高效的向量表示,有效提高了数据的稠密性和结构性。通过选择合适的网络结构和超参数,本文训练和优化了深度学习漏洞检测模型,并在测试数据集上进行了相关实验,来预测二进制程序模糊测试工具zuff的结果。实验结果表明,本文提出的深度学习漏洞检测模型的预测准确度最高可达92.28%。相比于传统的多层感知机模型,预测精度提高了 28.72%。在时间性能方面,模糊测试需要对每个测试用例进行上万次的运行,而基于深度学习的方法只需运行一次,预测效率也得到了较大提高。通过比较不同模型在测试集上的真正率、假正率和F值,可知卷积神经网络模型的F值最高。同时,本文也发现基于卷积神经网络漏洞检测模型的参数普遍要少,并且训练速度要显著快于基于长短时记忆网络的深度学习模型。通过对各个模型的最终性能比较可知,卷积神经网络模型在本文的漏洞检测任务中综合表现最好。
其他文献
长达55万余字的《中国当代歌词发展史》(上海音乐出皈社2014年12月出皈)是我国著名歌词作家、音乐文学理论家晨枫先生在所著《中国当代歌词史》一书的基础上,历时三载进行潜
为完善五年一周期的教师全员培训制度,进一步激发教师参训动力,促进教师终身学习,不断提升教师能力素质,2016年12月13日,教育部就大力推行中小学校(包括普通中小学、幼儿园、
政府公共危机是指在政府管理国家事务中,国家和社会在正常的运转过程中不可避免地会遇到一些紧急情况,如地震、流行病、经济波动、动乱、分裂活动、暴力犯罪、瘟疫横行、自然
破读字的读音存在着一定的混乱现象,亟待加以规范。本文就此进行探讨,认为对破读音的去留要审慎,既不可拘泥于旧读,又不可轻率放弃旧读,并提出了两条处理意见
一、论文的主要内容及观点在金融自由化、金融国际化、金融信息化的发展趋势下,商业银行的组织变革,是面对日益变化的经营环境所做出的一种积极的变革措施,究其实质是银行经
20世纪末的俄罗斯文坛,出现了一批才华出众的女作家,尤其是柳·斯·彼得鲁舍夫斯卡娅格外引起评论界的关注。她的创作细致入微地关注日常生活、死亡和在残酷世界中的女性命运。
组织等效正比计数器(TEPC)是测量微剂量学量的探测器。通过测量辐射场的微剂量谱和吸收剂量,进而计算出品质因子和剂量当量。本文首先介绍了测量微剂量谱的原理,叙述了几种组
游离漆酶不稳定,对周围环境较为敏感,难以重复利用,酶的固定化技术是近些年来解决以上问题的有效手段。本课题使用具有良好生物兼容性的330弱碱性环氧系阴离子交换树脂(简称33
采用硬度计SEM,EDS,TEM和XRD研究了经深冷处理和未经深冷处理Cr8Mo2SiV钢的回火硬度、残余奥氏体含量和碳化物析出行为.结果表明,Cr8Mo2SiV钢经1030℃淬火后,二次硬化峰值硬
新课标要求教师应创造性地理解和使用教材,积极开发课程资源,沟通与其他学科之间的联系,由语文课内向课外的延伸。可是在课堂教学实践中,部分教师由于对开发拓展阅读资源的意义与