基于EDSM的二进制协议状态机逆向

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:mnwang2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,网络应用中的协议技术研究也在迅速增加。计算机网络中的协议理解对维护网络安全具有重要的意义。但越来越多的网络协议属于私有协议,缺乏公开的规范文档。因此,协议逆向技术在协议分析领域具有重要的研究价值。协议逆向包括协议报文格式、语义逆向和协议状态机逆向两个方向。报文格式、语义逆向是对通过网络嗅探获取的协议报文或者通过动态污点分析获取的实体程序执行的指令流进行分析,挖掘报文的内部结构特征,并进一步推断字段之间的约束关系的过程。协议状态机逆向是在获取了报文内部结构信息的基础上,分析协议外部各个报文之间的时序约束关系,进而挖掘协议的行为特征的过程。本文中针对二进制协议格式固定,可能存在变长字段的特点,提出了基于多序列比对和基于值分布统计相结合的报文类型字段挖掘,利用多序列比对来识别变长字段,并对变长字段做剔除处理,再采用值分布统计的方法来挖掘报文类型字段。获得报文类型字段后,将网络嗅探获取的协议会话从报文序列流的形式转换成报文类型序列流的形式,以报文类型序列流作为状态机输入构建初始APTA树,并使用启发式算法对状态机状态进行标注,然后对相似的状态进行合并得到最终的DFA。推断出的状态机的性能很大程度上取决于状态合并的准确性以及合理性。由于EDSM算法具有准确度高、速度快、数据处理能力强等优点,所以本文采用了EDSM算法并进行改进来实现状态合并,并且给出了全新的评分机制。本文选取了TCP、SMB和DHCP三种典型的二进制协议对状态机逆向系统进行实验。实验表明本系统对报文变长字段具有很好的识别能力,使用EDSM算法逆向的结果准确率和召回率相比于当前传统算法较高。同时与EXBAR算法进行了对比实验,实验结果表明:在初始样本数据较少的情况下,EDSM算法逆向的结果召回率比EXBAR算法略低,但是EDSM速度快;在初始样本数据较多的情况下,EXBAR算法运行时间极为漫长,甚至最后完全运算不出来,而EDSM算法依然能够保证在多项式时间内完成,并且数据的增加使得EDSM算法能够相对的避免早期的一些局部合并错误,使得最终的协议状态机比较精准。
其他文献
随着互联网时代的飞速发展,广告载体逐渐由传统的报刊、杂志等媒介向网络转移,计算广告由此衍生出来。根据广告展现给用户的形式,可以将其分为展示广告和搜索广告,本文只对搜索广
21世纪,“互联网+”已经成为社会的热点话题,而“互联网+医疗”正是政府积极推广的新型在线医疗卫生模式,其中包含了构建电子病历等重要举措,大量的医疗信息数据随之产生。电
随着数据库和网络技术的飞速发展,大量的异构数据源应运而生。随着对信息综合利用需求的进一步提高,人们迫切希望解决这些异构数据源的集成问题。中间件技术的发展使得硬件平
三维真实感地形和自然景观的可视化是虚拟现实及可视化技术的基本组成部分,然而,庞大的数据在图形显示硬件有限的条件下不能很好的实时显示和处理。三维地形可视化通常包括地
局部特征描述子以编码的方式来描述图像局部信息,是图像处理技术中的一种基元特征,广泛应用于图像分割和三维重建等领域。随着手机等移动设备的快速普及,其上运行的计算机视
随着微传感器技术、无线网络技术和嵌入式处理技术的发展,无线传感器网络(Wireless Sensor Networks,简称WSNs)吸引越来越多的科研人员对其展开研究,并极大地方便了人们的生
目前,在视频分析和处理过程中,运动物体的实时检测和轮廓跟踪已经逐渐成为计算机视觉分析和识别的关键技术。尤其是人体运动分析的研究在人体动画、游戏、虚拟现实和增强现实
随着网络信息数据的急剧增加,因特网上信息量的日益扩大,人们在信息获取方面的要求也越来越高。语义网的出现为计算机提供了可理解的语义信息环境,计算机可以用基于语义的信
学位
随着互联网技术的不断发展,搜索引擎已经成为人们获取网络信息的主要工具。研究搜索引擎网页排序的目的是从众多搜索结果中将内容相关和权威的网页排在前面,帮助用户迅速定位