论文部分内容阅读
作为一种新的数据分析工具,数据挖掘的发展十分迅速。各种类型的数据都可以作为数据挖掘的对象。时间序列在数据集中十分普遍。对时间序列进行数据挖掘已成为当前研究的焦点之一。
本文在国内外时间序列数据挖掘最新研究的基础上,对时间序列数据挖掘中的趋势分析、周期分析问题和详细建模过程进行了研究分析,提出了用季节-周期时间序列模型和多变量时间序列CAR模型共同对电信业务收入情况进行建模预测,并设计了电信行业时间序列预测系统的框架,主要包括以下内容:
1.详细探讨了时间序列分析的建模步骤。从数据预处理、模型辨识、突变点检测、特性分析、模型阶次判定、参数估计到模型的检验和应用均作了细致的讨论。
2.结合数据挖掘的一般流程和软件工程知识及面向对象知识,设计了电信业务收入时间序列预测系统框架,然后根据现实可行情况,设计了具备可扩展性的并且集成了时间序列数据挖掘功能的电信业决策系统的体系结构。
3.在深入研究季节-组合模型和基于多变量的时间序列CAR模型的基础上,根据电信业务收入时间序列预测系统框架,利用2002年至2008年的电信业务收入数据和固定资产投资完成额、固定长途电话通话时长等八个统计指标数据,用DPS软件系统分别建立起了具体的季节-组合模型和多变量时间序列CAR模型(建模的过程中把八个统计指标合并为了五个指标),并给出了未来一年的预测值,结果表明多变量时间序列CAR模型是一种预测精度较高的预测模型。