基于深度学习的代码理解研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:huoxingtan22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
代码审查是高可靠性嵌入式软件开发中不可缺少的一个人工测试环节。近年来随着软硬件复杂性、需求多样性的增多,以人工为主的传统代码审查方法在效率上已逐渐不能满足现有的工程开发需求。为了减轻审查人员的压力,提升审查工作效率,代码审查在技术上急需获取新的突破。与此同时,以深度学习为代表的人工智能技术近几年在计算视觉、自然语言处理、机器人能等众多领域大放异彩,这让学者们注意到了它广泛的实用性。近年来,一部分研究人员在程序理解的研究中使用机器学习并取得了不错的效果,基于机器学习的方法逐渐成为程序理解研究领域的主流。虽然深度学习技术在各领域都取得了丰硕的成果,但它至今为止几乎没有应用于高可靠性软件代码审查的先例。本研究旨在从代码审查工作中目前存在的问题出发,积极探索深度学习技术应用于代码审查工作的可能性。研究内容包含两部分,分别是深度学习应用于高可靠性软件代码审查可行性分析和基于深度学习的程序理解方法设计与实现。在深度学习应用于高可靠性软件代码审查可行性分析研究中,以高可靠性嵌入式软件代码审查的实际工作为起点,本研究深入调研了代码审查的各方面资料和工作流程。在对代码审查与程序理解的理论知识进行概括性总结的同时,整理了相关技术的发展情况,分析了深度学习技术应用于代码审查中的可行性和应用前景。基于深度学习的程序理解方法设计与实现研究中,本研究以认知学习模式为理论基础,提出了一种解决代码审查中常见的程序理解问题——源代码功能分类问题的程序理解方法,以此来证明深度学习技术在代码审查工作中的适用性。本研究将代码审查的源代码功能分类任务中的程序理解分为了两个子任务,分别是程序认知和程序分类。为了实现能够完成这两个任务的算法模型,本研究使用注意力网络和卷积神经网络算法。程序认知算法能够将代码转换为代码语义特征向量,程序分类算法则使用这些特征向量完成程序分类工作。为了验证所提出的算法的性能,本研究在实验中使用了 30M的开源代码测试研究中提出的算法的效果。测试结果表明本研究提出的程序认知算法已经具备分类源代码功能的潜力,它在较小测试集上的分类精确率已经能达到近70%。程序分类算法在实际的代码分类任务程序上获得了更好地分类效果,且相较于基于文本的卷积神经网络分类算法获得了较为可观的提升。这不仅证明了研究中提出的程序理解方法是有效的,也验证了深度学习技术在代码审查工作中的应用潜力。本研究从理论和实践上验证了深度学习代码理解在代码审查中的可行性和潜力。相信是对高可靠性嵌入式软件代码审查的一次有意义的探索。
其他文献
随着计算机与互联网的发展,人机交互智能化已经逐渐成为一项重要研究课题,人机交互智能化也逐渐在影响人们的生活和工作方式,是身份认证等安保领域中重要的组成部分,如何使计算机理解人类情感变化,来创建一个积极友好和谐的人机交互环境,并且提升活体检测系统的准确性和防攻击性能已经成为该领域的一个富有挑战性的课题,吸引了越来越多的研究人员深入该领域的研究。本文通过对现有人机交互活体检测和表情识别算法的相关文献的
三维模型作为第四代数字媒体的基石进入了人们的生活,被广泛应用于众多领域。三维模型分割作为模型处理的关键技术之一,成为数字几何处理的研究热点。本文分类阐述了现有的分割方法及其优缺点,并针对现有自动化分割方法存在的分割结果不理想等问题展开了深入研究,提出了基于能量优化和表面特征的三维网格模型分割方法,主要内容包括:(1)本文针对现有分割方法存在的分割边界不准确和分割线锯齿化等问题,提出一种基于能量优化
金属的腐蚀是一个全球性问题,对发达国家和发展中国家的经济增长均产生不利影响。腐蚀会导致金属材料的大量浪费,从而导致全世界范围内的巨大经济损失。因此,腐蚀已经引起了学术界和工业界的广泛关注。近年来,镁及其合金因其良好的性能受到了广泛的关注,例如密度小、比强度高、导电性好等优异性能,在航天航空、军工以及汽车工业、电子等行业得到了广泛的应用。但是,镁及其合金的耐腐蚀性差,从而妨碍了它们在许多领域的应用。
学位
教育是提高人口素质的关键,是将人力资源真正转化为人力资本的孵化器,也是经济增长的源泉与国家发展的基础。义务教育作为教育事业的基础部分,办得好不好将会关系到社会是否
随着通信技术的快速发展中,社会大众对于携带小型天线的无线通讯设备性能的需求也随之增高。天线的设计作为无线通讯设备设计中的关键步骤,天线性能质量的好坏,取决于天线效率。天线效率的大小可以直接决定通讯设备的性能。天线的生产制造商们通常无法提供精准的天线效率,通常只能提供大致的范围,或者干脆不提供天线效率的值,因此如何准确测量天线效率就成为当下热门的研究方向。现实实际生活的场景非常复杂多变导致电磁环境非
2008年当市场牛转熊时,投资者遭受了巨大损失的同时,基金公司却挣了个盆满钵满,引起了投资者对以基金资产净值为基础的固定管理费率的不满和质疑;然而业内人士却表示国外公募
学科课程的核心教学材料是教科书,在教学系统中起着举足轻重的作用。随着上海市二期课改的不断深入,课程政策的逐步开放,全新的课程理念、多样的教科书不断涌现。自然教科书
在我国直接上市(IPO)成本较高且审查相对严格,非上市公司想要进入证券市场困难重重。上市公司的“壳资源”作为独有的上市平台,能够让企业获得在资本市场交易融资的权利,显然已经成为非上市公司格外青睐并且愿意加以利用的资源。借壳交易属于重大资产重组,交易金额巨大且影响广泛,在借壳交易过程中交易双方存在着严重的信息不对称,ST壳公司为了获得更高的卖壳收益,可能做出虚增资产、隐瞒负债、虚假披露重大事项等舞弊
竹纤维属于天然纤维的一种,因其可再生、低成本、易回收的特点越来越受欢迎,但其制备的复合材料力学性能与人工纤维复合材料相比稍显不足,本文主要以提高竹纤维增强复合材料的力学性能及其应用性能做出以下研究工作:第一,对VARI工艺进行了详细的介绍和描述。研究铺层结构对竹-玻纤混杂复合材料力学性能的影响,设计并制备了六种不同铺层结构的混杂复合材料,并对六种不同铺层结构的复合材料进行弯曲、摆锤冲击、四种能量下