基于机器学习的代码缺陷自动确认方法研究及实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:sophieyeah
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
静态代码检测工具主动执行代码检查以及分析,有助于提前发现并预防错误,能够在很大程度上提高软件可靠性并降低软件开发和测试成本。但是由此带来的问题是静态分析往往产生大量伪缺陷报告,人工审查误报是必要的。人工审查会耗费大量的时间和精力,因此优化静态检测工具产生的报告很有必要。本文在大量分析缺陷检测结果的基础上,提出了一种基于机器学习的代码缺陷自动确认方法。本文首先分析真实缺陷和误报之间的差异,将缺陷代码的度量元设计为缺陷所对应的变量的特征,提出了缺陷模式、控制流、数据这三种特征。然后给了每种特征的描述、分析以及提取策略。最后从全局内到达缺陷的路径上获取缺陷特征,将这些特征映射为机器学习向量,利用机器学习算法,实现了代码缺陷自动确认。本文所述的代码缺陷自动确认方法已经在缺陷检测系统(Defect Test System,DTS)中实现。基于特征提取结果,假如一个缺陷被确认是真实缺陷(或者误报),那么映射为特征向量后与之相同的缺陷也一定是真实缺陷(或者误报),同时,与其特征向量比较接近的缺陷极有可能也是真实缺陷(或者误报),这能减少开发人员确认缺陷的时间。本文对4个开源C工程的检测结果做实验,并与现有代码缺陷自动确认方法做比较。实验结果证明,该方法正确确认了约71%的缺陷,能较好地服务于DTS。
其他文献
Moran集在分形几何的研究中占有非常重要的地位,本论文研究的是一维Moran集,主要包括其分形维数与加倍测度意义下的胖瘦集分类两个问题.关于一维Moran集的分形维数,本文在第三章利用连通分支与其间隔构造了一类比齐次完全集范围更广的、特殊的一维齐次Moran集:{mk}-拟齐次完全集,并在一定条件下得到其Hausdorff维数的表达式为dimHE=(?).同时,还证明了该类集合在supk≥1{m
在管理学领域中,很多问题最后的模型都是建立出了一个目标函数,分为无约束和带约束的。无约束的多模态函数结构非常复杂,甚至维数很高,因此传统的求解方法难以获得令人满意的
近年来,计算机视觉领域不断发展,人体行为识别技术也随之渐渐变为该领域各专家研究的热门方向,该技术在很多领域都具有广泛的应用价值,这些领域小到人机交互、视频检索,大到智能安防和安全驾驶。近几年,深度学习技术得到了良好的发展,采用深度学习的识别方法逐渐替代传统方法,人体行为识别技术取得了突破性的进展。深度学习主要存在两方面的问题:一是网络参数量大、计算复杂度高;二是网络容易造成过拟合。针对这些问题,本
随着互联网技术的不断发展,不同用途的Web应用不断出现,Web应用呈现出涉及领域广、复杂度高等特点,令Web应用测试相较于传统软件测试工作的难度进一步提升。使用现有的Selenium测试工具进行自动化测试,门槛高、成本大。为了降低测试成本,提升测试效率,研究Web应用测试自动化测试方法?分必要。报告生成服务针对Web应用测试的特点,基于对测试执行的监控,实现Web应用自动化测试流程,包括测试结果的
边裂是镁合金轧制板材较显著的缺陷,因其垂直深度直接决定了后续精整工艺的切边量及最终板材的成品率,成为评价轧制板材成形性的重要指标。本文以铸轧态AZ31镁合金为研究对象,通过将等温恒速热压缩物理模拟、轧制试验、有限元分析以及残余应力测试相结合,从镁合金变形损伤行为角度出发,开展了不同轧制条件下边裂行为的预判研究,并提出了基于张应力轧制的边裂调控方法。基于热压缩物理模拟实验结果,分析了铸轧态AZ31镁
钒氧化物由于其独特的金属-绝缘相变(MIT)特性备受人们关注,目前在光电探测、场效应晶体管、热/光开关等领域得到广泛的应用。然而由于钒氧化物在生长过程中存在多达十三种相互竞争的钒氧化物相以及大多钒氧化物热力学不稳定等问题,使得高质量的、物相单一的钒氧化物,尤其是混合价态的钒氧化物(如V6O13)的合成面临巨大的挑战,成为制约钒氧化物特性及应用研究的一大问题。解决上述问题的关键在于掌握钒氧化物生长过
随着的我国现代化进程的推进,工业化和城市化也必然随之推进,城市周边的许多农业用地将被转化为非农业用地,农民也将失去其赖以生存的土地资源。由于政府在城镇化进程中对自
室内定位技术是指基于室内场景下的位置定位相关技术。在室内场景下,由于无法使用卫星定位等技术,因而借助部分其他传感器信号完成人员以及物体在该场景下的位置检测。随着基于位置的服务日渐火热,室内定位技术逐渐成为定位领域的研究热点。目前,室内定位领域通常使用无线通信技术、射频识别技术以及惯性传感器定位等技术实现定位目标的精准监控,同时,越来越多的研究者开始研究综合使用多种定位方式的融合定位算法。除此之外,
随着医疗行业信息化水平的不断提高,医学影像数据量日益膨胀,行业内普遍现状是对于这些具有多种模态的医学图像数据一直缺乏有效的管理和检索方式,多种模态的数据检索成为了亟需解决的问题。另外,如何快速检索到对医生有用的信息,解决检索过程中存在的效率问题也是需要考虑的,比如病灶的定位,而这在大多数时候还是依靠医生机械地在检索到的序列中进行寻找,计算机辅助分析的程度还不够。针对上述问题,我们构建了跨模态的医学
党的十九届四中全会强调坚持和完善生态文明制度体系,促进人与自然和谐共生,并阐明了生态文明制度体系在中国特色社会主义制度和国家治理体系的重要地位。绿色消费的法律制度和政策导向是生态文明制度体系的主要组成部分,因此,理解消费者绿色消费行为对完善和发展相关生态文明制度体系非常重要。本文以通勤者绿色交通消费行为为研究对象。为了明确在不同时间和伴随出行约束下消费者的绿色交通消费行为决策机制,本文以消费者行为