论文部分内容阅读
随着科学技术的发展,信息技术的日益推广,我们的社会正在经历着一场前所未有的信息化革命,信息的发展推动了生产方式的变革,进而促进了人类文明的进步和经济的快速发展。在医疗卫生领域内,随着医疗市场竞争的激烈化,国内各个医疗机构不断的要求提高自己的医疗信息化程度,医院信息化程度的高低已成为衡量一个医院医疗水平的一个重要标准。本文在充分调研医疗辅助诊断系统的基础之上提出了基于文本挖掘的案例推理系统的框架。在电子病历的基础之上,进行文本挖掘,由于大部分的电子病历系统为非结构化或半结构化的文本,并不利于知识的检索和重用,本文首先通过文本预处理、中文分词、特征的提取等一系列的步骤把非结构化或半结构化的病历信息转化为结构化的知识,其次通过案例的表示,把结构化的信息以框架的形式表示出来,把案例的编号,案例的属性值,案例的诊断等作为案例表示的内容。案例库采用三级的结构进行组织:系统级案例库,代表案例库和子案例库。对案例库中的案例属性值进行聚类,按照子案例库中的案例相似度要尽可能的大,子案例库间的案例相似度要尽可能小的原则划分不同的子案例库。在案例间使用“案例间相似度最大和”的办法找出代表案例。本文对系统的关键技术做了全面的研究和分析,包括案例的检索、案例的学习、案例的修改、和案例的维护。其中案例的检索是案例案例推理的核心,直接决定着案例推理的效率,本文采用分阶段的权值最近邻法来提高案例检索的速度,首先确定究竟是在哪个系统案例库中,然后在代表案例库CASE中检索代表案例c,最后才在代表案例库c所在的子案例库中检索相似案例。案例之间的全局相似性由局部相似性组成,通过相似度阈值的设定可以很好的检索出所要求的案例。随着案例推理能力的不断增强,案例库中案例的会不断增多,需要定期对案例库进行修改和维护。通过一个患有支气管炎患者的诊断证明了基于文本挖掘的案例推理系统可以为医生的诊断提供辅助信息,最后对本文进行总结和展望,结束全文。