【摘 要】
:
软件缺陷预测是一种以提高软件质量为目的通过预先识别可疑缺陷模块为软件测试资源分配提供决策支持的技术。但是软件缺陷预测模型的性能取决于所考虑的软件特征的质量。冗余和不相关特征可能会降低模型的性能,这就需要特征选择方法来识别和移除这类特征。本文针对软件缺陷预测中的特征选择进行深入研究,主要研究工作如下:(1)本文将软件缺陷预测特征选择问题转化为多目标优化问题。结合特征工程的实际意义,在综合分析模型运行
论文部分内容阅读
软件缺陷预测是一种以提高软件质量为目的通过预先识别可疑缺陷模块为软件测试资源分配提供决策支持的技术。但是软件缺陷预测模型的性能取决于所考虑的软件特征的质量。冗余和不相关特征可能会降低模型的性能,这就需要特征选择方法来识别和移除这类特征。本文针对软件缺陷预测中的特征选择进行深入研究,主要研究工作如下:(1)本文将软件缺陷预测特征选择问题转化为多目标优化问题。结合特征工程的实际意义,在综合分析模型运行耗时、特征子集规模、分类机器学习算法表现、模型性能等方面后,优化目标选定为最小化所选特征数量和最大化软件缺陷预测模型性能。(2)本文中多目标优化特征选择方法采用基于分解策略的高维多目标优化MOEA/D算法进行构造,称之为MOO-SDPFS(Feature selection for software defect prediction based on multi-objective optimization)。随后,我们将上述方法,在NASA MDP缺陷数据库(选取CM1、KC3、MC1、MW1、PC2、PC4和PC5八个实际项目数据集)和PROMISE缺陷数据库(选取ant-1.7、camel-1.6、jedit-4.3和xerces-2.0四个实际项目数据集)进行综合研究。实验结果表明,MOO-SDPFS方法在可接受时间开销内,对软件缺陷预测中特征选择问题可以进行有效处理。此外,本文继续探究基于过滤式、包裹式、嵌入式的多目标优化特征选择方法的优劣,最后根据实验结果进行实证分析,讨论多目标优化特征选择在软件缺陷预测上的积极作用。(3)本文设计并实现了一个小型软件缺陷预测多目标优化特征选择可视化系统。该系统将多目标优化的过程进行展示,并对软件缺陷预测中的关键信息进行反馈,便于对本文所提研究方法进行总结和改进。
其他文献
路径规划是移动机器人领域的关键问题之一,主要涉及移动机器人在工作空间中,从当前位置运动到目标位置的可行路径搜索。路径规划问题针对的环境可以是静态的,也可以是动态的。当环境中存在动态障碍物时,路径规划算法不仅要找到最优路径,而且要保持对最优路径的跟踪,以足够高的频率实时更新其路径,以保持对周围事件的响应。本文通过对已有的D*lite规划方法的分析,对该方法中的一些不足提出了相应的改进和优化。具体包括
随着扫描测量和计算机技术的不断发展,日常的二维图像测量扫描已经不能满足人们测量的要求,点云数据是三维图像存在的比较常见的形式,相对于二维数据,它能够更加高效存储三维物体详细信息,而激光雷达、Kinect等新型的三维传感器出现,使得点云数据收集会更加的便利,三维点云应用也会越来越广泛。但是目前的点云数据仍具有无序性、稀疏性的特点,并且一些小规模的点云数据集包含的信息及数量有限,所以通过点云数据预处理
计算机硬件计算能力的大大提高和大规模数据集的不断出现,让深度学习技术也在不断迈入新阶段。深度学习系统的发展在带来机遇的同时,也给其测试技术带来了新的挑战。与传统软件相比,深度学习系统在内部结构与外部表现方面均存在很大的差异,无法直接将传统软件测试技术中的白盒测试方法应用于深度学习系统。目前,已有多个关于深度学习系统的白盒测试覆盖准则被提出,但准则在实际系统中应用的有效性尚有待检验。本文主要研究深度
近年来,重大传染病疫情因其持续时间长、扩散范围广、危害程度高、防控难度大等特点,给世界各国经济发展及人民生活带来了严重威胁,成为各国公共卫生安全防治的主要议题。而由于疫情的突发性和不确定性,人们往往无法预测疫情的发生时间与强度,因此在应急物资调度初期及应急高峰期由于物资生产与储备不足或调度不及时等原因,应急医疗物资短缺问题时有发生。同时,随着疫情强度和扩散范围的变化,传染病应急物资调度往往具有动态
避障路径规划问题在因其在移动机器人、无人机(Unmanned Aerial Vehicle,UAV)、通信路由等领域广泛应用,一直是学者们研究的热门方向。针对路径规划问题学者们提出的算法层出不穷,其中快速随机搜索树(Rapid-exploration Random Tree,RRT)算法因其规划效率高、动态环境适应性强、高维可用、概率完备等优点,在路径规划算法中占有重要地位。本文采用基于位姿空间概
本文聚焦居民日用消费品城市配送物流的长期预测,从城市发展的宏观经济环境出发,提出了能够与不同发展进程的城市相契合的居民日用消费品物流需求预测方法,可充分顺应我国地区经济发展不平衡的国情,因地制宜地为我国各城市商贸服务业物流规划提供科学可靠的思路方法和理论支撑。首先,结合物流学科理论和相关标准,严格规范地界定了“居民日用消费品物流需求”的概念,并从多方面分析相关影响因素,构建居民日用消费品物流需求预
迁移学习是指根据已有知识和新知识之间的相关性,运用已有的知识来学习新的知识。按照是否使用深度学习方法,迁移学习可以分为传统迁移学习和深度迁移学习。当迁移源域和目标域的特征空间相同且类别空间相同,但边缘分布和条件分布不同时,该问题称为域适配问题。迁移学习的目的是为了解决在样本不足、标签不全等情况下,机器学习任务如何借助外部数据进行有效学习的问题。因此,迁移学习具有重要的实际应用价值。本人独立完成了如
对遥感图像中的道路进行自动识别与分割在地理信息系统数据的更新、土地管理、城市规划、军事打击等不同应用领域都有着十分重要的应用价值。随着科学技术手段日新月异的发展,机器学习和人工智能技术在人们日常生活中的应用更加广泛,如何利用深度学习算法更加高效地解决遥感图像道路分割的难点,提高遥感图像道路分割的精度,简化神经网络训练过程中的难度已经成为各国学者们的重点研究方向。本课题基于深度学习理论并结合可见光遥
随着我国经济快速发展,人们的生活水平逐步提高,生活节奏逐渐加快,消费观念开始转变,越来越多的人选择搭乘出租车出行,出租车行业规模日渐庞大,车载GPS系统等采集设备也积累了海量的出租车行驶数据。与此同时,出现了出租车定价体系不够合理、评价与监管体系不够完善、出租车资源浪费等问题。目前行业内对出租车的经营状况的画像研究还远远不够,无法做到针对出租车的个性化分析从而采取更有效的管理措施。因此,本文尝试基
在信息爆炸的时代背景下,大量重复冗余的信息充斥人们的生活,如何从众多无结构或半结构的信息里提取出高质量且精准的信息是信息抽取任务快速发展的原因之一。信息抽取在问答系统、数字图书馆等任务中都有广泛应用,实体关系抽取是其重要的子任务之一。传统和基于深度学习的实体关系抽取方法已经在实际应用中取得了较高的准确率,但其主要集中在特定领域,在面对不容易获得大规模监督训练数据集的实体关系抽取任务时,传统方法逐渐