健康医疗数据隐式关联关系的发现与度量

来源 :武汉大学 | 被引量 : 0次 | 上传用户:amao01010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国国家宏观健康管理策略重点已从疾病诊治转变为健康风险评估与预测。医疗行业信息化过程中已累积丰富的健康医疗数据,在群体层面蕴含着疾病发生与分布规律以及影响健康各种因素的知识,在个体层面为疾病早期预警及个性化医疗提供前所未有的契机。海量健康医疗数据中潜在关联关系的获取是我国健康医疗信息化发展的重要支撑技术。  当前数据关联关系挖掘的理论与方法难以满足健康医疗深度应用的需求,突出表现在(1)人群疾病与生命体征间的复杂关联(有语义)难以全面发现;(2)个体内部的复杂动力学相关性(无语义)难以准确度量。具体而言,健康医疗数据隐式关联关系发现面临着两大技术挑战:(1)群体层面的有趣关联规则挖掘。有语义健康医疗数据包含海量的数据项与事务数,蕴含疾病、各种生命体征的重要信息,探寻其中的有趣关联对疾病预防与诊断意义重大。传统数据挖掘方法的理论局限性导致上述复杂关联无法全面反映,同时难以应对健康医疗数据的规模与复杂度。(2)个体层面的复杂系统同步度量。个体健康医疗数据是个体复杂系统演化过程的记录,系统内部各部分的同步关系对个体健康状态异常的理解非常重要。比如大脑信息的传递需要众多神经元群共同协作完成,传统双通道与小规模同步分析方法难以应对健康医疗数据中大量无语义数据对象间的关联关系发现更谈不上量化分析。  针对上述问题,本文开展了针对健康医疗数据关联关系的发现和度量的研究,具体内容包括:(1)基于FP-Growth的复杂关联规则分析。针对海量有语义健康医疗数据,本文以包含慢性病患者的群体体检数据为研究对象,基于FP-Growth设计了一个高效并兼顾数据负相关性的关联规则算法,充分利用了FP-Growth算法效率高且适用于大型数据集的特点,并优化了剪枝策略,能够大幅度抑制在加入负相关性后算法复杂度上升带来的影响,在探索更多有意义的关联关系同时保证了算法效率。(2)基于复杂网络的同步分析度量框架。针对无语义健康医疗数据,本文以癫痫患者的脑电为研究对象,通过互信息与指数平滑规则构建的网络来表征无语义健康医疗数据的复杂动力学系统,进而通过复杂网络分析方法对其同步性进行度量,为全面理解癫痫患者多个脑区间的同步规律及内部状态演化提供有效的新方法。  实验结果表明:(1)PNFP-Growth算法相较于原算法能够有效地挖掘出系统内潜在的正负关联关系,且应对大规模复杂数据的表现良好;(2)基于复杂网络的同步分析度量框架能够有效地构建大脑功能网络,相较于传统时间序列分析方法,能够较为全面准确地同时得到系统的全局同步、局部同步和同步分布等属性。综上所述,本文提出的方法能够有效地对有语义和无语义健康医疗数据进行关联分析和同步度量,为数据驱动的健康医疗决策提供初步有效的方法。
其他文献
克隆整合(Clonal integration)和表型可塑性(Morphological plasticity)是克隆植物种群生态学研究的热点问题。以松嫩草地南部羊草(Leymus chinensis)草甸内分布的匍匐茎型无
本文通过对荣华二采区10
期刊
计算机断层成像技术(Computed Tomography,CT)通过X射线或者电子束的扫描获得病人断层投影数据而后重建得到图像,由于其无损性、精确性以及分辨率高等优点被广泛应用于医疗诊断
本文通过对荣华二采区10
期刊
本文通过对荣华二采区10
期刊