论文部分内容阅读
随着计算机及软件行业的发展,软件的规模正在不断的扩大,其复杂程度也在不断的增加,软件在整个计算机系统中逐渐变成了开销最大的部分。然而,自上世纪六十年代以来,以预算超支、质量缺陷及项目延期等为典型特征的软件危机不断出现。因此,对软件项目的成本进行估算就变得尤为重要。目前,各种不同的估算方法也相继而生,在各自适用的领域发挥着至关重要的作用,包括类比法、专家法及COCOMO模型法等。本文采用的是统计学中的回归分析法,它客观性强,有着较为成熟的理论体系支撑,能够在复杂的历史数据集中提炼出重要的信息,充分利用这些数据完成对软件项目成本的估算及预测。通过研究回归分析法的理论基础及算法原理,将回归分析方法中的一元回归、多元回归、逐步回归、岭回归及加权回归等的核心思想区分开来,并在软件成本估算过程中将它们运用到各自适用的估算阶段中。在建立软件成本估算模型之前,首先对软件成本估算的影响因素进行研究,以软件工程的生命周期为依据,借助功能点分析法,将各因素数值化,最终得出需引入回归模型的12个影响因子。在上述工作的基础上,基于回归分析的方法,构建进行软件成本估算的一般流程,针对各阶段可能遇到的问题给出相应的解决办法。在数据预处理阶段,完成对缺失值的补足及对异常点的检测和处理。采用逐步回归分析方法建立初始模型,并采用方差分析法完成对类别型因子的分析。在完成建模之后,对模型进行进一步的检验及校准,利用岭回归及加权回归等方法消除各影响因子间存在的多重共线性及异方差性问题,提高模型的拟合度。然后,引入平均误差率及预测范围概率对成本估算回归模型的预测性能进行分析。最后,针对具体的历史数据集进行仿真验证。构建了一个针对该数据集的软件成本估算模型,具体的计算了回归建模各个环节中的模型性能及预测能力,最后将该模型运用到实际项目中,结果证明了该模型的可行性。