论文部分内容阅读
Kamps(1995a)提出了一种被称为广义次序统计量的新理论方法,这种新方法包含了常见的次序统计量、序贯次序统计量和累进Ⅱ型删失次序统计量、记录值、k位记录值和Pfeifers记录值。广义次序统计量提供了一个可以应用于结构相似或类似的情形的通用方法,它可以将子模型的已有结果纳入、推广甚至整合在一个统一的框架内。而且,常见的次序统计量的推断性质和分布性质依然被广义次序统计量保留了下来,详情请参考Kamps(1995a,b)和Cramer and Kamps(2001).因此,广义次序统计量为分析和描述实际问题提供了一大类模型,该模型具有许多有趣而且有用的性质。基于这个理由,关于广义次序统计量的分布理论以及它们的性质能否像常见的次序统计量一样类似方式来获得是一个值得研究的问题。常见的次序统计量的性质已被广泛研究,可参考David(1981),Arnold etal.(1992)以及Balakrishnan and Rao(1998a,b)的工作。极值理论是一种主要的建模工具,也能用于统计评价。极值理论关注一个随机变量集合中的最大值或最小值,这里被研究的随机变量要么来自实际观测,要么来自于用于描述一个模型里的一些假设量。因此,极值理论不只是研究次序统计量的最小值或最大值,也研究在某些情况下会失去价值的极限值,例如,宇宙飞船可以因第一个失效的基础部件而坠毁。由于数学本身的需要和适应于应用前景领域拓展的需要,许多极值模型已经被提出,而在这些模型中经典模型的假设已经不再适用了。我们研究的主要目的在于聚焦最成熟的一类极值模型,在这类模型中极值都基于一个带有随机样本容量的随机抽样。事实上,在许多极值的应用中,样本容量常常是一个随机变量。或许对于这一现象一个重要原因是在许多生物学、农业和某些质量控制问题中,固定样本容量几乎是不可能的,因为许多观测往往会因为各种各样的原因而被遗漏。此外,随机样本容量也很自然地出现在序贯分析、分支过程、损害模型、点过程的稀疏以及最大记录值的研究中,同时在应用模型中引入随机样本容量能够让使用者在不同的情形选择不同的样本容量,请参考Galambos(1978,1987)的工作。在最早的例子中,随机样本容量是由于问题本身而产生的,因此统计学家不能控制样本容量和潜在随机变量之间的相关性。另一方面,如果引入随机样本容量作为一个模型的推广(主要是为了统计推断),人们通常会假设它与潜在随机变量是独立的。许多统计模型都假设你有样本观测值,这些观测值来自于同一个分布,而感兴趣的就是去建模这个分布。如果你实际上获得的数据是来自于不同的分布,而你又没有信息可以识别出哪一个数据出自哪一个分布,那么标准的模型往往会有助于你。但是,有限混合模型可能会让你看到希望。这种模型采用参数分布的混合形式来模拟数据,并且对每一个观测值,能同时估计出各个分布的参数以及它属于不同分布成分的概率。本博士论文的主要研究可以分为两个部分:第一部分研究了在样本容量被假定为正整数值随机变量时,广义次序统计量的某些重要函数的渐近性质。第二部分研究了在独立但不同分布的随机向量的多元有限混合模型下,线性标准化最大值的渐近分布。本文的大纲如下:第一章:在这一章里,我们简要地介绍了次序随机变量和广义次序统计量的基本概念,这些概念有助于读者阅读本文余下章节研究内容。本章还讨论了极值常见次序统计量和广义次序统计量的渐近理论及其对偶性质,介绍了常见次序统计量的函数的渐近理论,如伪极差、伪中极差、极值熵和极值积,解释了带有随机指标的极值以及独立但不同分布的随机变量的极限理论。最后,我们研究了对于常见次序统计量、广义次序统计量及其对偶的样本容量与标准化常数之间的关系。第二章:在这一章里,我们给出了基于广义次序统计量和对偶广义次序统计量的非随机标准条件下带有随机指标的极值积和极值率的极限分布函数。而且,本章也考虑了在随机和非随机指标模型下给出相同的渐近结论。我们给出了一些说明性的例子,它们进一步支持我们的理论结果。第三章:在这一章里,我们给出了在随机样本容量下,基于广义次序统计量的伪极差和伪中极差的极限分布函数。对许多最重要的分布函数,我们给出一些说明性的例子,它们进一步支持我们的理论结果。第四章:在这一章里,我们研究了独立但不同分布的有限混合模型的线性标准化最小值和最大值的渐近分布。本章主要考虑两种情形:在第一种情形下,我们同时获得了弱收敛的充分条件和极限形式;在第二种情形下,我们给出了当混合模型的成分有不同的线性标准化时弱收敛的充分条件。同时,我们也给出了一些例子。第五章:在这一章里,我们研究了独立但不同分布随机向量的多元有限混合模型线性标准化最大值的渐近分布,同时也获得了弱收敛的充分条件和极限形式。此外,我们还推导了当混合模型的不同成分有不同的线性标准化时弱收敛的充分条件,并给出了一些解释性例子,这些例子进一步支持我们的理论结果。