论文部分内容阅读
医保目录作为中国基本医疗保险制度框架中的重要组成部分,规定了基本医疗保险的保障范围,影响了基本医疗保险的保障水平。因此,合理制定医保目录是设计基本医保补偿机制中的关键问题。另一方面,医保信息系统的不断完善使得大量的医保数据得以累积,促进了数据挖掘技术在医保数据上的研究与应用,为医保目录的制定方法提供了一种新的思路。采用数据挖掘技术研究医保目录制定问题能够充分利用医保数据中大量的有价值的信息,从而使得医保目录的制定更加科学合理。闭频繁项集挖掘是最常用的数据挖掘技术之一,用于发现大规模数据集中频繁出现的模式。它被应用于多个研究领域,其算法得到国内外学者的广泛研究。然而,在面向实际应用时,易于加入约束条件的且对爆炸式增长的数据具有高可扩展性的并行闭频繁项集挖掘算法却寥寥无几。本文在易于加入约束条件的闭频繁项集挖掘算法CHARM的基础上,针对其不足之处给出几点理论进行改进,得到一个具有更高时空效率的NEWCHARM算法,并给出NEWCHARM算法的三种并行实现方式,最终得到一个易于加入约束条件的并行闭频繁项集挖掘算法PARACHARM。本文利用PARACHARM算法对医保目录的合理制定问题展开了研究。首先,对医保目录的合理制定问题进行了定义,将该实际问题转化成了闭频繁项集挖掘问题。接着,提取并分析了该问题中的约束条件,设计了基于约束的PARACHARM算法用于解决该问题。最后,在经过数据预处理之后的医保费用明细数据上进行了实验,根据实验结果提取了“新”目录,模拟了“新”目录的运行,并分析了其运行效果。结果表明,“新”目录的运行效果要好于随机制定的目录,可以为医保目录的制定提供建议和参考。