论文部分内容阅读
随着我国体育事业的快速发展,体育领域内积累了大量的数据信息有待整理和挖掘。《中国体育事业统计年鉴》是一部综合反映我国体育事业发展水平的统计资料,目前对该信息资源的开发利用一直停留在较低层面上,受众范围小,数据挖掘深度不够。在信息技术飞速发展的今天,如何利用成熟的计算机技术、网络技术和数据挖掘技术,实现对该数据资源的高效开发利用,发现隐藏在海量数据背后的价值信息,是摆在我们体育信息工作者面前亟需解决的问题。 本文采用文献资料法、专家访谈法、数据挖掘法等多种方法,综合运用软件工程理论和数据库技术,对2001-2009年《中国体育事业统计年鉴》数据结构深入分析的基础上,将现有的102张数据表的数据内容进行整合,设计了数据库表的逻辑结构,分析了中国体育事业统计年鉴信息系统的用户需求,在C#和SQL环境下开发了基于C/S模式的信息系统,实现了对该信息资源的查询、添加、删除、修改、导入、导出、报表打印等操作。 本文对信息系统的设计实现,解决了数据开发利用的基本存储和检索问题,对隐藏于海量数据信息背后规律的探索,借助了数据挖掘方法及工具。数据分析时,在EXCEL中编写VBA宏程序,实现了对《中国体育事业统计年鉴》综合部分数据的灰色预测分析。选取了十一届全运会成绩、优秀运动员人数、体育支出三个指标,运用SPSS统计软件,对各省区的体育发展水平进行了因子分析和综合评价,并对因子分析的整个流程进行了flash动画设计。 主要结论: 1.开发基于C/S模式的中国体育事业统计年鉴信息系统,实现了对该数据资源的网络化、数字化管理,扩展了受众范围,提高了对数据的管理和应用水平。 2.利用Excel宏程序实现了对2002年-2009年获冠军个数的灰色预测分析,通过周期修正提高了预测精度,可用于后续年份的预测。 3.运用SPSS软件对各省区体育发展水平进行了因子分析,将全国体育发展水平进行了梯队划分,基本反映了我国体育发展水平的区域状况。