论文部分内容阅读
本文主要研究Erlang混合分布的估计和统计性质,其密度函数是h(x;α,γ,θ)=m∑ j=1αjxγj-1e-x/θ/θγj(γj-1)!,x>0,其中α=(α1,…,αm)是混合权重系数,γj是Erlang分布的整数形状参数,θ>0是尺度参数。 Erlang混合模型主要应用于金融、保险领域,在保险破产理论和保险损失数据的拟合中都有重要应用,模型适合分析保险数据的异质性,同时对于保险人关心的指标有显式解析式。Willmot&Woo[67]给出Erlang混合模型在破产理论中的应用,当投保人的损失额服从Erlang混合分布时,有限、无限时间破产概率,随机破产时刻的拉普拉斯变换等都有显式解析式。类似的研究可以参阅[7,41,47,63]等文献。Lee&Lin[43]给出Erlang混合模型在保险损失拟合中的应用,计算了常见的风险度量指标Value-at-risk(VaR)和tail VaR(TVaR); Verbelen[64]等在Erlang混合模型中引入双边截断,这方面的研究还有[23,64,65]等文献。 混合模型的线性结构很好的刻画了异质性,但是产生了不可回避的问题:混合数(序)的确定。很多学者讨论过正态混合模型序的确定,主要包括最小距离法[15,38],假设检验法[17,18,25,26],惩罚似然法[1,16,40,58]等。Erlang混合模型序确定的文献比较少,Lee&Lin[43]和Verbelen[64]都采用传统的BIC来确定,但是并没有给出BIC在Erlang混合分布中统计性质的说明。 混合模型的线性结构与线性回归的结构很相似,Fan&Li[31]提出应用于线性回归模型的SCAD惩罚函数,SCAD通过惩罚回归系数,同时实现了变量的选择和回归系数的估计。受Fan&Li[31]的启发,本文提出一种新的惩罚函数,命名为iSCAD,将其应用于Erlang混合模型,通过惩罚权重参数,运用EM算法,给出了混合模型的权重参数的阈值式估计(π)(k+1)j=(q)(k)jI((q)(k)j>aλ)+M/λ((q)(k)j-λ)+I((q)(k)j≤aλ)同时实现了参数的估计和模型序的确定,而且估计量满足稀疏性、连续性和无偏性,即关于零邻域内的权重参数的估计具有稀疏性,远离零的权重参数的估计具有无偏性,估计关于样本是连续的。 本文第二章给出参数估计量统计性质的证明,借鉴Wald[66]的证明,基于一些必要的引理,定理2.4.6证明了极大惩罚似然函数的估计满足一致性,推论2.4.8证明了混合模型序估计的一致性。第三章针对左截断为l的Erlang混合分布,详细阐述如何利用EM算法来估计混合权重参数和Erlang分布共用的尺度参数。本章进行两个模拟实验,同时将模型应用于实际保险损失数据,结果说明本文建议的方法比传统的BIC方法更有效,验证了模型和算法的有效性。 本文关于模型的选择是通过删除小权重的分量模型来实现。保险数据的尾部是大额且稀疏的,其相应的权重很小但不可删除。为克服这个缺陷,第四章引入极值分布,用于拟合大于阈值μ的尾部数据,建立了Erlang极值混合模型,参数ψμ将密度函数分为两部分,拟合数据主体的Erlang混合分布,拟合数据尾部的极值分布,iSCAD仅作用于Erlang混合分布的权重参数,Erlang混合分布的参数估计仍然满足一致性。类似地,通过模拟实验和实际数据说明模型和算法的有效性。