基于深度自编码网络的软件缺陷预测方法与实现

来源 :重庆大学 | 被引量 : 0次 | 上传用户:lmd1028
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件规模和复杂度的不断增长给软件数据带来了大量缺陷,而含有缺陷的软件在运行时会造成难以想象的后果,严重时甚至会给社会带来巨大的经济损失。因此如何提升软件质量目前成为软件工程领域中最为重要的问题。软件缺陷预测技术能在软件开发初期,及时准确地预测出软件模块是否具有缺陷,帮助测试人员合理有效地分配有限的测试资源,降低软件维护成本,进而提高软件质量。软件缺陷预测方法的预测效果与数据集自身的特点有着密切的相关性,通过研究发现,目前软件缺陷预测过程中常出现缺陷数据分布不平衡、特征信息冗余以及特征维度过大的问题。针对这些问题,结合深度学习对数据特征强大的学习能力,本文提出了基于深度自编码网络的软件缺陷预测方法。本文使用的这种方法包括一种基于无监督学习和随机采样的混合采样方法,解决了数据集中类不平衡问题,同时使用深度自编码网络的数据特征进行降维,有效提升了数据样本的质量,进而提升缺陷预测模型的性能。主要工作内容如下:1)阅读了大量国内外相关文献,总结当前软件缺陷预测过程中常见的挑战,包括软件缺陷数据不规则、缺陷数据分布不平衡以及特征信息冗余等问题。2)提出了一种基于无监督学习和随机采样的采样方法,该方法能有效提升数据集中缺陷数据的比例,解决缺陷数据分布不平衡的问题。3)构建了基于深度自编码网络的软件缺陷预测模型,该模型集成了软件缺陷预测过程中的各个阶段,包括数据预处理、采样、特征降维以及分类器训练,旨在通过这个模型解决本文总结出的缺陷预测中的挑战。4)使用了三个开源项目的数据集以及三种不同的分类器算法进行实验,并且对比了两种常见的特征降维方法PCA(特征提取方法)和HFS(特征选择方法)。实验结果证明基于深度自编码网络的软件缺陷预测模型具有可行性和一定的普遍适用性。5)将本文提出的研究方法与实践结合,设计并实现了一个软件缺陷预测系统,并将基于深度自编码网络的软件缺陷预测模型集成到该系统中。
其他文献
氢能源来源广泛、清洁无污染并且热效率高,被认为是未来理想的新能源。但由于氢气遇明火具有较强的爆炸性,氢气泄漏的探测问题随着氢能的广泛应用变得越来越重要。半导体型氢
火灾是世界上发生频率最高、时空跨度最大的一种灾害。钢筋混凝土结构作为我国使用最为普遍的结构形式之一,在火灾或高温下,混凝土和钢筋的力学性能(如抗压强度、抗拉强度和
随着中国经济的高速增长,发展模式的持续转型以及科学技术的不断深入发展,中国与国际间的机械工程技术交流与合作日趋广泛,分析材料微观形貌时广泛使用的进口扫描电镜开始大
随着信息时代的蓬勃发展,各行各业产生的数据量近乎以指数级的方式递增。人们对于数据的钻研不断地精益求精,对于数据所带来的效益追求可谓永无止境。因此有关数据处理的问题
目的:探讨胃癌组织及癌旁正常组织内趋化因子受体CCR1及CCR5的表达水平,并分析二者和胃癌临床病理特征之间的关系,同时探究CCR1及CCR5在胃癌组织内表达的相关性。方法:收集承
《“十三五”推进基本公共服务均等化规划》中首次推出国家基本公共服务清单,并提出建立国家基本公共服务清单制度。基本公共服务清单制度是我国建立健全基本公共服务体系的重要基础,是促成基本公共服务均等化的创新之举。基本公共服务清单制度作为我国清单制度体系的一员,具有清单制度公开、高效的特征,更凸显了公平性和公共性。基本公共服务清单制度还具有进一步实现政府职能转变和服务型政府建设的功能。通过运用文献分析法梳
一维TiO2纳米管阵列由于具有良好光电特性和垂直结构,能够为光生载流子的传输提供快速的通道,在染料敏化太阳能电池(dye-sensitized solar cells,DSSCs)的制备中有着广泛的应
目的建立小鼠局部淋巴结试验模型检测红花注射液的致敏性,探讨其用于评价中药注射剂致敏的可行性。方法将BALB/c小鼠随机分为9组,每组10只,设阳性对照组(链脲佐菌素、2,4,6—
多环芳烃(Polycyclic aromatic hydrocarbons,PAHs)是土壤中典型的持久性有机污染物。我国土壤PAHs污染日益加剧,严重危及农产品安全和土壤生态系统健康。微生物修复技术具有经济绿色、环境友好等特征,已成为PAHs污染土壤的主要修复手段之一,然而由于受到土壤组分和环境因素等影响,微生物修复效率偏低,有待进一步提高。本研究以高分子量多环芳烃高效降解菌Paracoccus
超短脉冲激光数控加工中,激光参数与加工速度等参数不匹配会导致加工宽度与加工深度过大或过小问题,激光参数自适应控制是解决该问题的重要途径。现有可查阅到的激光参数自适