论文部分内容阅读
控制图是应用统计方法和计算技术对各种工业过程或服务行业中的一个或多个变量进行监控,从而达到提高产品和服务质量的目的.大部分现有的控制图是用于监控位置或尺度参数。虽然在很多应用领域,监控一个过程的位置或尺度参数问题非常重要,但是对于过程变量的整个分布的一般变化的监控也是我们非常需要的,因为其他的分布特性,比如形状参数,也是非常重要的质量指标。大部分现有的控制图还假设一个过程的质量指标的分布类型是己知的,而只有参数是未知的,这被称为参数控制图。但是参数控制图只是在特定的应用中有效,而且实际中经常并没有关于过程分布的充分了解。在很多实际应用中,也需要在过程启动阶段或短程的生产过程中进行监控,因此也经常需要使用自启动的控制图。本文正是在这样的背景下,主要研究下面4个问题:用于监控过程指标变异程度的控制图;用于监控过程指标的任意分布变化的控制图:基于多元斯米尔诺夫检验的用于监控一般变化的多元控制图;基于最小生成树的用于监控一般变化的多元控制图.我们利用统计计算和模拟技术,发展了4个新的控制图,来解决这些当前质量控制领域的具有挑战性的问题。接下来我们分别给出介绍。大部分现有的控制图假设一个过程的质量可以被该质量特性的分布所充分表达,受控和失控时的变量分布只体现在几个参数的不同。但是参数控制图只是在特定的应用中有效,而且实际中经常并没有关于过程分布的充分了解。比如,虽然在很多应用中(尤其是过程启动阶段),已经充分的认识到,潜在的过程分布是未知的,并且不是正态的,但还是经常假设过程数据服从正态分布。因此,这些经常使用的控制图,在正态分布的假设下表现的最好,但在实际中其统计性质将受到很大的影响。因此在这种情况下,需要用到非参数控制图。而大部分非参数控制图主要是用于监控过程变量的中位数,但是监控过程变量的变异程度也是非常需要的。尽管如此,却很少有用于监控过程变量变异程度的非参数控制图。在第1章里,我们发展了一个新的非参数控制图,通过整合一个两样本非参数检验(Mood1954)和有效的变点模型。模拟研究显示所提出的控制图在监控过程变量变异程度方面优于其他非参数控制图。因为该方法在监控之前就避免了一个很长的数据收集阶段(虽然建议至少拥有20个热身样本),并且它不需要关于潜在的过程分布的知识,因此所提出的方法在启动阶段或者短程生产过程中特别有用。大部分非参数控制图主要是用于探测过程变量的位置参数的漂移。尽管如此,监控整个分布的任意变化,比如尺度或者形状参数的变化也是非常有用的。比如,一个只涉及某个尺度参数的下降的分布的变化就代表了过程质量的提高,这就需要实际操作者及时的学习和推广这种质量的提高。尽管如此,文献中却很少有用于探测任意分布变化的非参数控制图。Zou and Tsung (2010)提出了一个新的控制图,通过吸收一个新的非参数似然比拟合优度检验统计量到EWMA控制图。他们的方法容易计算,但却有一个调节参数λ需要选择。Ross and Adams (2012)提出了一个控制图,通过整合全局的Kolmogorov-Smirnov检验和Cramer-von-Mises检验到变点模型。这两种控制图都可以探测比位置漂移更广泛的漂移。众所周知,拟合优度检验可以探测任意分布的变化。比较著名的拟合优度检验包含Kolmogorov-S mirnov检验,Cramer-von-Mises检验,和Anderson-Darling检验。Zhang(2002,2006)提出了一种参数化方法,用于构造基于非参数似然比的更一般的拟合优度检验。它不仅能产生前面的传统的检验,而且能产生新的全局检验,一般来说,这些新的检验比传统检验更有效。在第2章里,我们发展了一个新的与分布无关的控制图,通过整合有效的两样本非参数似然比拟合优度检验到有效的变点模型。模拟研究显示所提出的控制图在绝大部分情况下,在监控过程变量的任意分布的变化方面优于其他非参数控制图。尤其是在探测一个只涉及某个尺度参数的下降的分布的变化方面特别有效。因为该方法在监控之前就避免了一个很长的数据收集阶段(虽然建议至少拥有19个热身样本),并且它不需要关于潜在的过程分布的知识,因此所提出的方法在启动阶段或者短程生产过程中特别有用。一个实际的数据例子表面该方法在实际应用中拥有很好的表现。当需要同时监控一个过程的几个质量特性时,就需要用到多元统计过程控制图。大部分多元控制图方法都是基于一个过程数据服从多元正态分布的基本假设。尽管如此,在很多实际应用中,已经充分的认识到,潜在的过程分布是未知的,并且不是多元正态的。因此,这些经常使用的控制图,在多元正态分布的假设下表现的最好,但在实际中其统计性质将受到很大的影响。因此在这种情况下,需要用到与分布无关或者稳健的控制图。大部分多元控制图的优良表现一般都是基于拥有大量的历史观测数据,用以对未知的过程分布有足够的认识。尽管如此,在很多应用中,我们却没有很多足够的历史观测值。用于校准所需参数的受控的历史样本数通常相当小。在这种情况下,将对参数估计带来相当大的不确定性,从而将干扰控制图运行长度的受控分布。这就需要能同时处理序贯监控和参数估计的自启动的控制图。最近,Zou et al.(2012)发展了一个用于监控过程位置参数的基于空间秩和EWMA的多元自启动控制图。它在一类很广泛的总体模型上有与分布无关的性质,即,控制图运行长度的受控分布总是等于或者接近于用于多元正态分布的相同的控制限的控制图的运行长度的受控分布。但是他们的方法留有一个调节参数λ需要选择,并且当λ不是很小时,比如说λ≥0.05,它的受控的平均运行长度的表现将是不令人满意的。因此他们的方法可能只对小到中等的漂移有效。在第3章里,我们发展了一个新的稳健的自启动的多元控制图,通过整合一个基于多元经验分布函数的两样本多元斯米尔诺夫检验到有效的变点模型。模拟研究显示所提出的控制图在监控过程变量的大漂移方面优于其他多元非参数自启动的控制图。与分布无关的控制图是有用的,当缺乏潜在分布的知识时,尤其对于多元观测值。众所周知,基于多元经验分布函数的两样本多元斯米尔诺夫检验效率不是很高。在第4章里,我们发展了一个基于图论中的最小生成树的多元的与分布无关的自启动的控制图,通过整合一个多元两样本拟合优度检验和变点模型。正如我们所期待的,模拟研究表明所提出的控制图对非正态数据相当稳健,并且在探测过程漂移方面,尤其是对于中到大漂移,非常有效,而这恰恰是文献中大部分与分布无关的多元控制图的主要缺点。因为该方法在监控之前就避免了一个很长的数据收集阶段(虽然建议至少拥有一些热身样本),并且它不需要关于潜在的过程分布的知识,因此所提出的方法在启动阶段或者短程生产过程中特别有用。比较的结果和一个实际的数据例子表明该方法在实际应用中拥有很好的表现。在第5章里,我们给出了全文的结论,并提出了一些今后的工作设想.