论文部分内容阅读
估计是统计学的两大任务之一,而对于总体分布的参数进行估计已有大量的研究。在用样本数据对参数进行估计时,往往由于计算公式很复杂而无法得到我们想要的结果,这时攻克计算难题显得尤为重要。由Dempster等人于1976年提出的EM算法是一种迭代计算方法。在保证计算结果收敛性的前提下,它在处理一些复杂计算上具有良好的效果。目前主要应用于缺失数据、分组数据、截尾数据和截断数据等情形下总体分布的参数估计以及一些数学模型的参数估计。本文研究的是双参数指数分布的参数估计。在处理数据时,将缺失数据、分组数据、截尾数据和截断数据等几种情形进行了很好的融合,即在观测截尾数据的同时考虑到有缺失数据的情况,同时又将缺失数据进行分组得到分组数据,然后又研究了截断数据的情形。在估计双参数指数分布位置参数时,一律用观测样本的最小值作为它的极大似然估计,而估计双参数指数分布尺度参数时,方法比较多样,主要有以下两种:(1)填充算法:用已观测到的数据的和的均值对缺失数据进行了填充,讨论了截尾缺失数据下双参数指数分布尺度参数的极大似然估计,且讨论了该估计的无偏性和大样本性质。(2)EM算法:一般情况下,分组数据的分组依据即每组的起始时刻和终了时刻都是预先给定的,而本文将已观测到的数据作为数据分组的起始时刻和终了时刻,然后利用EM算法给出了尺度参数的估计。文中主要结论通过以下定理的形式给出:定理1:在假定第一个观测值不丢失的情况下,(?) = X(1) = min(X1,X2,…,Xn)为双参数指数分布位置参数μ的极大似然估计;(?)为双参数指数分布尺度参数β的无偏估计且其方差为(?)。其中Zj的定义为公式(5),CnkPk的定义为公式(4)。定理2:(?)+X(1)→β+μa.s.且(?)N(0,β2/p),其中N(0,β2/p))表示均值为零,方差为β2/p的正态分布,(?)表示依分布收敛。定理3:在截尾缺失数据情形下,不考虑截尾时刻与无穷大时刻组成的区间,双参数指数分布的尺度参数的EM算法的计算公式为:其中μ取它的极大似然估计X(1) = min(X1, X2,…, Xn)。定理4:在截尾缺失数据情形下,考虑截尾时刻与无穷大时刻组成的区间,双参数指数分布的尺度参数的EM算法的计算公式为:其中μ取它的极大似然估计X(1) = min(X1, X2,…, Xn)。定理5:在数据截断即至少有一个区间观测数据个数未知情形下,考虑截尾时刻与无穷大时刻组成的区间的观测个数未知且个数服从负二项分布,双参数指数分布的尺度参数的EM算法的计算公式为:其中P的定义为公式(17),μ取它的极大似然估计X(1) = min(X1, X2,…, Xn)。