二进制代码相似性并行分析

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:lschx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二进制代码相似性对比是软件安全技术的一个基础的技术,可用于软件剽窃检测,恶意代码检测,软件补丁分析和自动逆向分析中。然而目前的二进制代码相似性对比技术普遍存在效率性,准确性,规模性,方面的问题。代码相似性对比技术的效率性和准确性是一对矛盾的属性。理论上来说,对比技术越是复杂和精细,对比的准确性就会越高,然而这会使得对比过程十分的耗时,无法应对大型的代码对比中,反之,采用较为简单和粗略的对比方法能够降低对比过程的耗时,却不能保证对比的准确性。在规模性方面,目前的二进制对比工具主要是基于内存进行的,对代码提取出来的特征无法永久化的存储起来,这使得每一次对比过程都要进行重复的特征提取步骤。代码相似性对比技术的基本研究问题是检测一个程序中的一个组件是否与另一个程序中的一个组件相似,并定量地度量它们之间的相似性。组件可以是单个函数,一组函数或整个程序。本文针对二进制代码对比技术存在的问题,研究了在二进制函数级别的对比技术,主要工作如下:1.本文针对目前二进制代码对比技术存在的问题,设计了一个二进制代码代码对比算法,主要提出了二进制函数特征的选择及提取方法,同时基于提取出来的特征设计了启发式的函数对比算法,实验表明算法的准确性较高。2.实现了二进制代码并行分析框架。为了进一步提高对比算法的效率,充分挖掘算法中可并行的部分,采用分布式编程工具包,实现了一个二进制代码并行分析工具。实验表明工具在进行二进制代码对比分析时有着较高的性能。3.实现了一套海量二进制代码特征存储与检索机制。在规模性方面,目前的二进制对比工具主要适用进行一对一的比较,在只有待分析的二进制文件而无法掌握相似的已分析二进制文件的情况下,这样的方法并不适用,此外,作为安全分析人员,我们希望能够将已分析的具有参考价值的二进文件,如具有某一漏洞的库等以一种方便进行对比的方式存储起来。针对这个问题,提出了二进制函数特征的存储机制,使用图数据库Jaunsgraph存储二进制函数特征,并制定了数据模型,构建了分析需要的二进制代码样本库。
其他文献
在轨服务技术可以在空间中对卫星加注燃料、维修、载荷更换等操作,有效的延长了卫星使用寿命。在轨捕获是在轨服务的前提,空间末端执行器可以代替人力执行多种太空操作,在降
轮胎在不同的激励下表现的力学特性完全不同,因此不同的轮胎模型适用于不同的工况。适用于分析轮胎低频力学特性的轮胎模型经过国内外学者的不断研究已经趋近于完善,但是用于
各种网络应用的出现给人们的生活带来了极大的便利,与此同时,用户的隐私问题也受到了越来越多的关注。网络数据通常采取图来表示,如社交网络图、商业贸易网络图等。这些图可
不确定数据流作为一种特殊的数据流类型,广泛存在于环境监测、基于位置的服务、金融股市交易以及Web信息系统等众多实际应用中,对不确定数据流进行高效查询分析已成为当前大
随着我国社会人口结构不断走向老龄化,老年人面临的各种问题日益凸显。由于老年人机体各系统已经衰退,自控和保护能力逐渐下降,跌倒、撞击甚至不良的姿势都有可能引起四肢和
在自然界中,颗粒物质是一种特殊物质形态,其自身特征既不同于固体也不同于流体的,颗粒物质往往表现出比普通固体和流体更为丰富的力学特性,其根本所在于颗粒系统内部固体粒子
近年来无人机的导航控制技术发展迅速,其中航向的精确控制尤为重要。目前大部分室内无人机大多采用无线通信定位惯性导航及视觉导航等技术,但视觉导航发展不成熟,不能够广泛
Fe3N作为备受瞩目的磁性纳米材料具有高硬度、高饱和磁化强度、耐摩擦等优异物理性能。并且在替代稀有及昂贵的贵金属催化剂领域也有潜在应用。但是合成Fe3N磁性纳米材料的氮
媒体的健康新闻报道不仅有利于公众了解疾病问题和健康医学知识,预防和减少疾病的发生,促进公民健康行为,而且有利于国家完善健康卫生政策和医疗保障制度。故此,关于糖尿病报
海洋蕴含着丰富的资源,而遥控无人潜水器是人类探测海洋资源的重要工具。遥控无人潜水器是一个较为复杂的系统,一般来说遥控无人潜水器由水面控制系统、脐带电缆和水下系统组