软件数据挖掘的若干问题研究

被引量 : 0次 | 上传用户：gu22540

【摘要】

：

关系数据库在1972年诞生后,数据库技术便取得了飞速的发展。随着数据库管理系统的广泛应用,人们收集数据的能力有了巨大的提高,积累的数据也越来越多。这些海量的数据中潜藏

【作者】

：

吴戴林

【发表日期】

：

2009年期

【关键词】

：

数据挖掘软件工程数据挖掘有趣活动软件修改历史模式

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

关系数据库在1972年诞生后,数据库技术便取得了飞速的发展。随着数据库管理系统的广泛应用,人们收集数据的能力有了巨大的提高,积累的数据也越来越多。这些海量的数据中潜藏着大量重要的、有趣的信息。然而这些隐藏在海量数据中的有趣信息是很难被人们发现,所以许多学者都在研究如何从这个海量数据源中快速高效地获取有趣信息。由于传统的统计学分析方法已经不能够满足目前的需要,于是数据挖掘技术便应运而生。数据挖掘(Data Mining)是人工智能与数据库领域当前研究的一个热点,引起了大量学者与专家的关注。数据挖掘有许多功能,比如关联分析、聚类分析、例外分析等,与之相关技术的应用也非常成熟。利用这些成熟的数据挖掘技术[1]研究软件工程数据是本文的主要研究内容。一个软件工程在其周期里面会产生许多数据(如文档,源代码,代码库,配置文件等),当然这些数据中也隐藏着许多有用的信息。这些信息可以帮助程序员发现代码中的存在但是没有在当前系统中出现的潜在bug、更好的模块化系统、重构遗留系统、以及增加系统的稳定性、健壮性和可靠性等。软件工程数据挖掘在进几年受到了许多学者的关注,他们也提出了许多算法帮助程序员更好的了解软件数据。本论文的工作主要由以下几个内容组成:(1)数据挖掘和软件数据模式挖掘综述。对当前主要的数据挖掘技术以及应用做简要的叙述,接着从软件工程学的角度出发,分别从需求、文档、开发、测试、维护等五个方面阐述数据挖掘技术在软件工程中的应用。包括各个方面的经典算法,以及将来比较有挑战性的难题等。(2)系统运行时的有趣操作模式研究。软件系统在运行时会产生很多的运行日志,它记录系统所产生的所有行为,如用户操作历史,错误信息等,并按照某种规范表达出来。系统维护人员可以根据这些日志(如错误修复,负载均衡等)来维护系统。我们收集系统在运行时产生的操作流程日志,利用数据挖掘技术分析这些日志,从中找到有趣的知识。在这部分将讨论数据挖掘技术如何从运行日志中发现有趣的知识。(3)软件修改历史数据中的模式发现和软件代码(software repositories)bug检测技术研究。随着信息技术的发展,软件系统越来越大,代码量螺旋式的增长,从而程序中的bug和错误的出现是不可以避免的,这些bug和错误不仅增加了维护难度,也增加了软件的成本花费。软件开发人员对软件进行维护的时候,往往会出现这样的情况:由于模块之间存在依赖性,修改软件的一个小模块,通常都需要修改与之相关的模块,这种依赖性很难用传统的动态或静态分析技术[2]进行检测。本文通过数据挖掘技术来研究软件修改历史中的模式,即发现那些经常会一起被修改的代码。这些模式可以帮助软件开发人员发现模块间的依赖性,通过这些依赖性来检测代码潜在的bug。当软件开发人员对软件代码的某个地方进行修改时(假设执行一次维护任务),我们的方法可以有效的为其提供与本次维护有关的其它代码,即软件修改历史模式。(4)最后对本文所做的工作进行总结,包括本文的创新点、不足之处,以及本文进一步工作的展望。

其他文献

现代美国的神话文化融合的桥梁

在美国华裔文学史上,汤亭亭是第一位成功进入美国主流文学的女性作家。其作品最鲜明的特征是将中国文化大规模的移植进英语文本。在其代表作《女勇士》中,她大量运用并改写了

学位

原型批评原型神话鬼疯女人流亡者文化融合

强化同业业务流动性管理

<正>市场流动性紧张的背后是银行同业业务与理财产品相互对接交易,进行监管套利,同时利用期限错配赚取息差,引致同业、理财资金自我循环美国次贷危机的教训之一是银行同业业

期刊

同业业务期限错配买入返售应收账款理财产品流动性管理信托受益权信贷资产

中国市场营销研究英语论文综述——基于内容及来源的描述分析

本论文研究分析了有关中国大陆市场营销状况的英语论文的广度和深度,以及撰写这些论文的学者和他们的所属教育机构。我们发现,尽管中国的市场营销仍处在起步阶段,但是相关论

期刊

中国经济中国市场营销中国市场营销国际期刊市场营销研究

依法治国:治国理政的基本方略——学习习近平依法治国重要思想的体会

党的十八大以来,习近平同志多次就法治建设发表重要论述,阐述了全面推进依法治国,提高党的执政能力和科学水平的目标和路径,极大地丰富和发展了中国特色社会主义法治理论。深

期刊

习近平依法治国宪法权威司法体制改革

公共财政框架下农民养老保障体系的构建

自20世纪90年代初开始,我国在农村地区开始推行以社会养老保险制度为重点的改革,这一举措取得了一定的成效,但由于多种因素,现在仍存在着很多问题。主要表现为农村农民的养老

学位

公共财政养老保障城乡一体化

知识产权壁垒的产生原因和应对策略——从我国企业建设国际贸易品牌的角度分析

我国的市场经济正从以产品为核心的实体经济过渡到以品牌为核心的品牌经济。随着品牌产品知识技术含量的增加及各国对知识产权保护意识的增强,知识产权对品牌建设的作用越来

期刊

国际贸易品牌知识产权壁垒知识产权保护

我国行政问责制的理论与实践

行政问责制作为当代中国社会主义政治体制改革的制度创新,是我国依法治国的重要表现,是民主政治不断发展的必然要求,也是我国政府迈向责任政府的重要一步。目前,我国的行政问

学位

行政问责制现状困境对策

超精密标准齿轮齿距精度实现方法的研究

标准齿轮,也叫测量齿轮,是高精度齿轮检测仪上的计量基准,要求其传动精度非常准确,且其精度至少要高于被测齿轮2-3级精度。近年来,随着机械化工业的发展,各行各业对高精度齿

学位

齿距精度分度盘正弦消减法多齿分度法

基于作业成本法的分部价值管理研究

本文论述在新经济市场环境下,随着我国加入WTO,越来越多的中国企业走出国门参与全球范围的竞争和跨国公司对我国的投资力度不断加大。跨国公司、集团公司等复杂企业组织结构

学位

价值管理时间驱动作业成本法转移定价经济增加值

微信助力教育教学

<正>在信息技术飞速发展的今天,微信正成为学校和社会越来越普遍的网络通信工具。教育正在由传统的模式向物联网时代转变。微信作为便捷的交流平台不仅在图文、视频、语音等

期刊

展示平台

软件数据挖掘的若干问题研究

其他学术论文