论文部分内容阅读
近年来,计算机处理及存储能力的提高以及医疗技术的高速发展产生了海量的生理信息数据。运用时间序列数据挖掘技术和相关的医学基础知识对这些数据进行挖掘,可以分析疾病致病因素、预测疾病变化趋势、优化配置医院资源、合理规划药品采购计划,对开发医学研究治疗新技术、促进医院管理水平、提升医疗质量均具有重要意义。例如在重症监护室(Intensive Care Unit, ICU)中,危重病人需要24小时连续监测多项生命体征指标,如心电、血压、血氧、呼吸、体温等,这会产生大量生理数据。而ICU的临床医生需要同时监护多个重症病人,可能无法即时观察到病人出现的生理状态突变,导致贻误抢救时机。因此采用数据挖掘技术分析病人的生命特征参数并预测其生理状态变化趋势,可以实现ICU病人的智能监护,并对临床决策支持系统的发展与完善具有重要意义。为此,本文开展了以下几方面的研究:首先,分析研究了目前主要的时间序列相似性度量方法,比较各种方法的特点及适用领域;其次,重点研究并实现了基于极值的动态时间弯曲(DTW)目似性度量方法以及符号化的统计特征向量空间相似性度量方法。同时借鉴网络搜索引擎与文档检索的思想提出并实现了基于信息检索模型的空间向量模型相似性度量方法。并针对生理时间序列变化趋势复杂的特点,采用SYNDATA (The Control Chart Synthetic Dataset)数据集验证并比较了三种算法的性能。发现基于信息检索模型的空间向量模型相似性度量方法具有较高的识别率。最后,使用MIMIC-II数据库提供的ICU病人生理信息建立了一个小型的ICU病人生理状态样本库。根据病理生理学知识及临床信息的可获得性确立病人生理状态稳定性的分类标准,并借鉴网络搜索思想尝试进行ICU病人生理状态稳定性的判断与预测。方法是以测试生理时间序列为关键词搜索样本库中与之相似的时间序列,根据搜索结果判断测试序列的生理状态稳定与否,由此实现病人生理状态稳定性的预测。相似性度量方法则采用上文提出的基于信息检索模型的空间序列模型算法。预测结果根据MIMIC-II数据库中病人实际生理状态和药物治疗记录进行了评估。