软件缺陷自动分派研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:su9989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代大型软件系统,特别是像Eclipse和Firefox这样的开源软件中,随着系统规模的增大和功能需求的增加,会不断有出现新的缺陷被检测和报告出来,因为数量庞大,所以人工地将这些缺陷分派给合适的维护人员进行修复,需要大量的时间和人力。同时,这样的大型系统中都会配备有专门的缺陷跟踪系统,以保存已提交缺陷的信息和处理过程,这些已有的历史信息为软件缺陷的自动分派提供了可能。软件的缺陷自动分派就是利用缺陷跟踪系统当中已经解决的那部分历史数据,结合数据挖掘的方法,将新提交的缺陷报告自动分派给合适的修复者的过程。传统的软件缺陷自动分派方法都是基于文本分类的,这种方法将缺陷报告中的描述信息看成文本,将修复缺陷的人员看成是文本的类别标签,通过在已经修复的历史缺陷报告上训练分类器的方式,对新提交的缺陷报告进行分派。但是相比于文本分类,软件缺陷分派有许多自身的特点,比如说文本信息较少,类比较多,软件缺陷拥有缺陷类型,所属平台等等基本属性信息,同时缺陷的修复者之间,具有一定的交互性等等。这些辅助信息都可以用来提高缺陷分派的效果。本文对软件缺陷自动分派的问题进行了研究,分析了这一问题的产生的背景和意义,同时还对软件缺陷分派的历史现状和主要方法进行了回顾,并且总结了软件缺陷分派问题中的主要特点。针对用单词表征缺陷报告文本时含有的特征空间维度高、数据稀疏且包含噪音等缺点,本文提出了一种基于主题模型的软件缺陷分派方法,通过PLSA和LDA两种模型,将缺陷报告的表征从单词空间映射到主题空间,进而在新的低维空间上进行缺陷分派。对比试验的结果表明,本文提出的基于主题模型的方法,对于提高缺陷分派的准确率和降低特征空间的维度,都有着明显的效果。
其他文献
随着网络上信息的爆炸式增长,普通搜索引擎的查询结果越来越不能满足用户查询的需要,尤其是那些查询特定信息的不同领域、不同背景的用户,因此适应特定主题和个性化搜索的垂
随着信息技术高速发展,人们对信息安全的需求也在不断的提高,身份识别技术正受到更多的关注。传统识别技术由于其固有的不足,已经难以满足人们日益增长的安全需求,生物特征识
在高度信息化的当今社会,随着市场经济的不断深入,企业规模的不断扩大,企业内部的组织生产方式以及管理方式产生了比较大的改变。为了应对这种前所未有的挑战,在竞争中立于不败之
人脸检测是计算机视觉领域被广泛研究的课题之一。近年来,深度学习在计算机视觉、语音识别、自然语言处理、多媒体等诸多领域都取得了巨大的成功,卷积神经网络作为一种深度模型
工作流技术是通过工作流对企业级业务流程化的管理。但由于市场环境的瞬息万变,企业需要不断地改善自身的业务流程过程,进而要求工作流模型,也能够自适应与动态地对业务需求
随着计算机与互联网技术的飞速发展,构成整个互联网的网络设备越来越多,网络通信协议作为一种网络通用语言,保证各网络设备间的顺利通信。为了了解网络设备间的通信是否符合
21世纪互联网和信息技术的发展正前所未有地影响和改变着人们的工作、学习和生活。互联网和信息技术的进步在给人们带来快捷、便利的同时,也给残疾人带来了新的机遇和挑战。
随着科技的发展,视频监控已经越来越多地应用于我们的生活。视频监控的精确性以及可回放性,方便了我们解决生活、工作中的纠纷。由于视频采集要求实时性,需要较高的传输速率,成熟
随着我国社会经济的迅速发展,人民生活水平的提高以及高速公路数量的逐渐增加,道路交通的自动化管理越来越成为我们需要亟待解决的问题,智能交通系统的重要性日益突出。车牌
在Web服务组合中,外部子服务通常会定义访问控制策略以保护资源被安全的使用,同时组合脚本中也存在着复杂的逻辑控制结构,这两点因素使安全管理员在描述组合服务的访问控制策