基于TBCNN的代码自动生成质量和效率评估方法的研究与实现

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:qiuyu19900318
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
代码自动生成在很大程度上可以简化程序员的开发工作,并且可以提高软件开发的效率,代码自动生成也成为当前研究的热点。目前代码自动生成技术的部分研究已经应用到了实际开发中,依据某种代码自动生成方法实现的代码自动生成工具通常以插件的形式嵌入到集成开发环境中,以帮助程序员提高开发效率。代码自动生成质量与效率会直接影响程序员的开发效率,完善的代码自动生成质量与效率评估不仅可以有效的对生成代码进行评估,同时也有助于发现代码自动生成工具本身存在的问题。现有研究中,缺乏针对代码自动生成质量的统一评估方法。多数研究使用Precision、Recall、MRR、F1-Measure作为评估代码自动生成质量及效率的指标,但这些指标仅考虑了代码自动生成个数及生成代码的正确性对质量和效率的影响。在使用代码自动生成工具实际开发中,影响质量和效率的因素有很多,程序员的行为在其中也起到了较大的作用。现有评估方法没有考虑到代码自动生成过程中代码上下文动态变化的特性,只集中在有限的属性。大部分研究采用不同的评估指标,且各指标之间无法直接转化,缺乏统一的评估方法,难以对各种代码自动生成模型和方法进行对比。针对以上问题,本文主要开展了以下研究工作:(1)为了对代码自动生成质量和效率进行评估,本文对代码自动生成过程和结果进行了分析,结合代码自动生成过程中程序员行为与代码自动生成工具的特点建立代码自动生成质量和效率评估模型。(2)通过代码自动生成过程分析程序员行为与代码自动生成工具信息中可能影响代码自动生成质量与效率的特征。依据以上特征提出了一种程序员行为与代码自动生成工具信息监控方法。考虑到代码上下文对生成代码质量和效率的影响,本文定义了一种MAST(Multidimensional Abstract Syntax Tree,MAST)特征树,通过MAST中的信息对代码自动生成过程中存在的特征进行表示。使用TBCNN(Tree-Based Convolutional Neural Network,TBCNN)对MAST进行特征提取,将提取到的特征使用全连接神经网络映射到代码自动生成质量属性和效率属性。通过代码自动生成质量与效率属性的赋权,实现代码自动生成质量与效率评估。(3)实现了程序员行为与代码自动生成数据采集工具。基于代码自动生成质量与效率评估过程,实现了一个代码自动生成质量与效率评估原型工具,并通过实验验证了本文提出的代码自动生成质量和效率评估方法的有效性和合理性。
其他文献
在互联网的快速发展下,商品的流通迎来了机遇与挑战,烟草行业卷烟营销在新零售下迎来了新的发展,打破原有的零售模式,拓宽新的路径,利用互联网的发展与技术,给烟草行业带来新的生机。文章通过分析新零售模式下的发展与现状,以及烟草行业卷烟营销在新零售下的改革与创新进行了论述,提出了看法与建议。
脆性组氨酸三联体(fragile histidine triad,Fhit)基因是1996年Ohta等人用外显子捕获法克隆并鉴定出来的第一个普通型脆性位点基因,该基因横跨脆性位点FRA3B,定位于染色体3p14.2上。经细胞生物学、肿瘤分子生物学研究,并通过转基因、基因敲除等技术证实其为一种新的抑癌基因,与肿瘤的发生发展密切相关。已经发现在大约70%的人类上皮肿瘤尤其是环境致癌物诱发产生的肿瘤中出
神经生长因子(nerve growth factor,NGF)是最早被发现的神经营养因子。天然的NGF由3个亚基(α、β和γ)组成,其中,仅β亚基具有生物学活性。β-NGF是由118个氨基酸的肽链以非共价键组成的同源二聚体。它不仅是神经细胞生长和修复必需活性物质,在神经系统、免疫系统和内分泌系统的相互作用中有着重要调节功能。而且具有促进伤口愈合、细胞生长和抑制肿瘤细胞生长的作用。尤其对于因胆碱能神
本文从二维GIS与三维GIS发展和应用的角度出发,探讨了常见的二三维一体化GIS几种模式的特点和缺陷,提出了二三维一体化GIS在数据模型、渲染接口、空间坐标系及矢栅一体化上需要解决的一系列问题。重点对地图投影及坐标系、多比例尺矢量数据在球面上的表达、矢量数据在三维API中的符号化进行了较为系统的分析、论述和试验。本文完成的主要工作有:1.通过对平面模型地图中地图投影概念的分析,总结了地图投影及平面
构建军民科技协同创新体系是一项重要的战略,其对促进国防建设与经济建设融合发展、建设科技强国、以及打造世界一流军队具有重大的意义。本文从京津冀物流产业角度出发,对军民科技协同创新体系进行研究分析,以立足河北,服务京津冀区域为根本任务,选举京津冀三地军队院校、地方物流企业、地方普通高校为调研对象,开展走访调研、信息采集工作,从而获取第一手资料,整理归纳形成调研报告。
互联网时代的到来改变了人们生活的各方各面,在线社区的出现让人们在获取信息、拓展和维持社会关系的方式上发生了巨大改变。与此同时,信息全球化作为经济全球化的新动力将传统的国际贸易加以网络化和电子化,国内外贸易新业态的不断涌现向外贸物流行业发起新的挑战。如今,物流行业中拥有足够物流知识的专业人员远不能满足外贸物流行业在业务上的需求,而在线物流社区的出现让很多身为物流从业人员的用户可以不受地域和时间上的限
随着互联网及科学技术的快速发展,素有“第三利润源”之称的物流业在其支撑下得以迅速发展,成为现代经济的重要组成部分。2019年我国社会物流业总额达到298万亿元,占据了极大的社会价值,但是由于地区之间经济发展水平、基础设施等存在巨大差异,东中西部的物流发展水平同样也极为不平衡。因此,深入分析东中西部物流效率发展现状及影响因素,继而有针对性地提出对策,实现东中西部地区物流业协调发展,具有的重要的理论和
云南地处我国西南边陲地区,地形地貌多以高原为主,其地貌形式限制了工业发展,农业已经成为了当地的重要基础产业。中央和云南省委、省政府根据云南的地形地势特点和经济发展的基础,同时密切结合我国当下的农业发展政策环境,对云南做出准确的定位,因地制宜的提出了具有高原特色的农业发展战略,在科学、和谐、跨越式发展的背景下,形成具有高原特色的、可持续的、健康的高原特色农业种植服务平台具有长远而重大的意义与使命。本
课程思政是将人文精神、科学素养与爱国教育融合到教学中的一种课堂授课方式.相比一些文科课程思政,理工科的课程思政的课程设计难度更大一些.本文致力于研究光学课程思政教学改革,探索一种切实可行的课程思政的教学模式.本文以《光学》教学大纲为线索,将中国古代与近现代光学科学家的生平与研究成果、中国部分光学研究机构的成果和光学公司的产品介绍对应地插入到光学课程各章节的课堂学习中.这些内容,要和课堂内容相对应,
法制是社会稳定健康发展的重要保障,促进司法现代化是适应社会发展的必然要求。智慧司法是司法现代化的重要方面之一,推进司法智能化能够有效促进司法工作快捷高效运行进而服务于社会。自然语言处理技术是智能化的重要技术手段,应用深度学习算法可以学习到大量法律文书文本的信息,进而智能化的辅助司法工作。案情阅读理解是自然语言处理技术的一种,它能智能化的模仿人类阅读法律文书,进而自动的从当前内容分析、查询相关信息,