论文部分内容阅读
随着医保政策的逐渐成熟和网络技术的迅速发展,医保数据海量积累。针对医保基金的收支出现了很多精算模型和方法。这些研究对医保政策的调整和改善起到了重要的作用。但是国内医保政策实施较晚,对医保基金的研究还不是非常完善,模型相对简单,方法也比较传统。如何建立一个准确高效的医保精算模型仍然是很多医保精算类文章研究的重点。另外对医保数据分析方法的研究也仍然有改善的空间。首先,本文提出了按病种核算的医保基金支出的精算模型。以往的模型考虑到了职工身份、年龄等方面造成的支付比例不同,但是没考虑到各种疾病本身的分布和均次费用的差异,要真正做到了解和控制医疗费用,必须从单病种医疗费用分析入手。所以本文将各种疾病的差异考虑进模型中,提出了按病种核算的医保统筹基金支出模型。该模型的在计算过程中考虑到了起付线和部分统筹费用的自付比例部分,使该模型更接近实际。住院统筹费用的支出是年度医疗统筹基金支出中数额最大的一部分。所以单病种的次均住院费用也是该模型中一个重要参数。以往文献中研究该指标使用最广泛的方法是多元线性回归。回归模型中自变量的选择一直是研究者根据自己的研究目的而定,对研究者的相关领域知识有较高要求且缺乏客观性。因此本文尝试了利用粗糙集属性约简的算法在众多的条件属性中选择相关的影响因素。使得该方法具有更广泛的适用性。粗糙集的属性约简是近年来数据挖掘领域的研究热点。其中,RR (Random Reducts)算法是一种针对大型数据集的粗糙集约简的较为前沿的算法,通过对条件属性列的随机抽取,按照相关算法计算得分,从而提高了约简效率。本文在RR算法的基础上做了改进。在原算法的基础上添加了对行的随机抽取;每次抽取完毕后,将得分低的列以一定的比例舍弃。从而提高了整个算法的精度和效率。理论的研究是为了实际的应用。最后,文章用某市2004-2013年的医保数据,按照上述方法预测了2014-2016年部分疾病的医保统筹支出的费用,证实了该方法的可行性。并对预测结果做出了分析。