基于关联规则和聚类的数据挖掘在临床检验信息系统中的应用研究

被引量 : 7次 | 上传用户:suzengbiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
临床检验信息系统(Clinic Laboratory Information System,CLIS)是医院信息系统的一个重要组成部分。它基于数据库,利用网络和计算机实现软件和仪器的无缝连接,模拟检验科的工作流程,实现检验信息的电子化和检验信息管理自动化。 临床检验信息系统的应用产生了大量的数据,采用数据挖掘方法对这些数据进行分析开采,发现有用知识,是目前亟待开展的工作。但目前国内尚无这方面的报道,国际上也处于探索阶段。 本文结合糖耐量试验和血细胞计数两项检验数据,详述了在检验信息系统基础上进行的数据预处理,数据挖掘和知识发现的全过程。并重点阐述了关联规则挖掘和聚类分析两种数据挖掘方法在实际中的应用。 本文重点介绍了对糖耐量试验数据的预处理,以及关联规则挖掘在糖尿病诊断方面的应用。 糖耐量试验数据来自医院信息系统中的病人基本信息,从检验信息系统中提取的糖耐量试验数据,以及从一些调查表中得到其他辅助信息。在填补了空缺值、对定性数据量化处理、属性范围变换、统一量纲、以及删除了无关孤立点之后,文中采用SQLSERVER DTS将其引入数据仓库,以SQLSERVER ANALYSIS MANAGER为平台将数据集成,构造多维数据立方体。 为提高数据挖掘的效率,必须针对主题对数据属性进行维规约,排除无关属性,保留相关属性。维规约采用贪心算法,逐步向前选择有用属性。在属性的相关性分析中采用了熵增益技术,设定最小信息增益,引入新的属性后计算熵增益值,和最小信息增益阈值比较,来决定属性的有用性。 关联规则挖掘是数据挖掘中的重要应用之一。本文采用了经典的Apriori算法,并且在原有关联规则中支持度和可信度的概念基础上,引入了兴趣度概念,
其他文献
在高温等苛刻环境下运行的机械密封,其辅助系统的有效运行十分重要。根据现场案例分析了辅助系统问题对机封的影响,可供相关设备管理与维护者参考。
人类进入知识经济时代,知识成为现实的生产力,而拥有知识的人也逐渐成为推动知识经济发展的重要资源,人力资源的经济重要性在不断提高,同时人力资源的产权要求也得到进一步的
随着我国经济持续快速发展,人们生活水平的提高,环保意识的增强,能源结构调整,以及住房制度、供热制度的改革,西气东输、俄气南进等燃气工程计划的实施,作为一种清洁高效的能
随着越来越严峻的水资源短缺形势,缺水已成为制约经济社会发展的资源“瓶颈”,也是制约贵州农业发展的关键因素。农业是用水大户,贵州农业用水占总用水量的70%,节水首先应从
政府采购制度改革作为我国公共财政改革的重要组成部分,引入我国从试点到推广实施仅有十年的时间,却取得了巨大的进展,尤其是《政府采购法》的颁布实施对我国政府采购的规范
同伴教育是指在教学过程中允许学生相互合作,解决难题的一种教学方式。新课改后,对于教学方法有了更多的要求,多样化的教学能够明确学生在教学中的主体地位,能够提高教师的教
1.口蹄疫该病是牛羊等偶蹄动物的一种具有高度传染性的急性传染病,其特征是在口腔黏膜、蹄间、乳房发生水疱和烂斑。
随着教学改革的深入发展,小组合作已经火遍了全国的初中语文课堂。这一课堂活动形式在提高学生的课堂参与度、体现学生在课堂中的主体地位的同时,也出现了很多问题。要解决这
视觉是人类感知环境世界,认识外部世界的主要途径。随着计算机技术的不断发展和人类对数字化信息需求的不断增加,计算机视觉和双目立体视觉得到了极大的发展。由于摄像机标定
互联网和信息技术的发展,使得用户可利用的信息资源迅速膨胀。这给人们的信息利用提供了巨大的便利,而有限的个性化信息却显得更加分散。这使得用户在利用信息的过程中,容易