论文部分内容阅读
中医理论的发展源远流长,如何充分利用其间积累的大量中医文献资料,为医学理论的进一步探讨提供支持成为目前亟需解决的重大问题。计算机技术的发展,特别是数据仓库、OLAP和数据挖掘理论与技术的发展,为决策支持提供了强有力的技术基础保障,实现了将信息转化为数据,利用数据发掘出知识。因此,如何充分利用这些理论与技术为中医理论的发展提供支持,将文献资料信息转换成规范化数据,建立数据多维立方体,对其进行多角度、多层次的分析和数据挖掘完成对特定中医理论的论证成为亟需探讨的课题。本文围绕中医毒热数据仓库系统的设计和构建,实现对毒热为胃脘病等常见疾病的主要病因且总体治法为清热解毒、消痈生肌这一推断的论证提供支持这一中心阐述对数据仓库体系结构的研究,包括数据仓库体系结构,元数据的作用与整建,数据仓库概念模型、逻辑模型、物理模型的设计与实现。数据仓库开发方法的研究,利用RUP即统一开发过程实现数据仓库的增量迭代开发,设计与实现保证数据质量的流程,数据仓库数据总线结构的设计与开发。数据仓库应用的研究,包括OLAP,即在线联机分析;数据挖掘;OLAM,即在线联机挖掘等等。根据上述理论和开发技术,参照在医学领域应用成功的数据仓库与数据挖掘相关项目,深入问题领域应用建模方法,针对中医毒热文献特定的复杂的数据格式和数据类型,完成了将中医毒热文献信息转化为关系数据库中的规范化数据,充分利用关系数据库对数据管理的强大功能进行数据清洗和转换。同时,利用开源ETL工具,构建强健、可重用的ETL过程组件,实现了关系数据向多维数据的提取、转换、加载。本文还利用数据仓库数据总线技术进行主题划分,完成了各个数据集市的多维数据立方体的构建;通过实现Mondrian和Tomcat的良好集成构建了基于Web的OLAP平台,在此基础上为满足用户需求设计实现了相应的OLAP业务分析功能;同时,将OLAP业务功能模块与Web层其它功能模块相结合实现了一个完整的数据仓库应用原型系统。在数据仓库设计开发的各个层次各个阶段充分保证了数据仓库的数据质量,特别是利用RUP开发方法构建中医毒热数据仓库系统,充分利用了其增量迭代开发和风险控制的特点极大改进了数据仓库系统的构建。通过实践证明,本文建立的原型模型是可行的,并且取得较好的效果。