论文部分内容阅读
如果没有对海量数据进行科学分析的能力,沃尔玛的老板再精明,也绝对想不到“啤酒与尿布”这两个风马牛不相及的东西之间还有着千丝万缕的联系。而将它们放在一起,竟然增加了啤酒的销量,可见数据分析的巨大威力。信息系统数年中收集了海量数据,而且它们还在以指数级增长。企业迫切地需要高效、精确和科学地分析这些数据,以找出其背后的寓意,进而了解企业的经营状况和外部环境,做出科学的决断,在现代激烈的竞争中胜出。所以,如何将数据点石成金,便是摆在我们面前很现实也很诱人的一个问题。 决策支持系统是计算机技术应用于科学管理领域以来的第三种模式,它吸取了前两种模式的优点,成为信息系统研究的最新发展阶段。数据仓库、数据挖掘和联机分析处理是有着紧密联系的三种数据处理技术。准确把握它们之间的区别与联系,以及各自的优点与不足,不但能够充分发挥它们在处理数据方面的特长,而且为把它们的优势结合、互补不足提供了可能。文中比较了它们之间以及它们与数据库的关系。 OLAM理论是近年来数据仓库技术领域内研究的热点。从这个概念提出以来,国内外的研发人员对其进行了不懈地技术攻关;但是由于课题本身的复杂性,总体来说,该理论的现实应用一直滞后于理论本身的进展。到目前为止,尚且没有开发出真正的OLAM产品;OLAM理论本身还只是由数据挖掘和联机分析处理松散地结合,这样的裂缝一直没有有机地弥合起来。文中针对阻碍OLAM概念发展的若干问题提出了处理意见。 烟草行业在当今社会占有举足轻重的地位。卷烟配方是香烟生产过程中一个重要的工艺过程,合理的配比方法不但能为企业带来丰厚的利润,还能为社会节约资源以及满足社会各个阶层人士对于香烟的需求。于是,如何对某个烟草企业的卷烟进行科学的配方就是一个具有重要现实意义的课题。通过建立数据仓库,把卷烟配方过程中涉及到的数据进行清洗和处理,然后运用数据挖掘技术,对这些数据进行深层次的挖掘,找出隐藏在这些数据当中的重要的、尚未为我们所知的规律,供决策者使用。文中以卷烟配方为实例,介绍了一个具体的数据挖掘支持系统的完整构建过程。