论文部分内容阅读
统计过程控制图在工业生产、疾病防治、环境监测等领域有着非常广泛的应用。近年来,随着自动化传感器技术和大规模数据存储技术的迅速发展,各种各样结构复杂的数据得以被收集和保存起来,使得控制图方法的灵活性和有效性面临着前所未有的巨大挑战。在这种情况下,文献中现有的传统控制图方法已不再适用于复杂数据,因此,我们迫切需要针对各种类型的复杂数据开展控制图理论与方法的研究。在本论文中,我们主要针对四种类型的复杂数据进行深入探讨,包括分布未知的一维相关数据、高维数据流、半参数动态系统以及带有跳跃点的profile数据,并提出控制图在线监控或异常诊断方法。当一维过程分布未知且存在序列相关性时,我们提出一个非参数的自启动累积和(Cumulative sum,CUSUM)控制图来对分布未知的一维序列相关数据进行在线监控。该控制图不要求任何参数形式来描述过程的受控分布,同时通过一个基于Cholesky分解的去相关程序来消除观测之间的相关性,解除了用参数时间序列模型描述过程相关性的限制。其唯一需要的就是一个小型规模的受控历史数据集来提供受控参数的初始估计,这些受控参数的估计会利用自启动(Self-starting)方案进行迭代更新以提高估计精准度,解除了受控历史数据有限的限制。与现有方法相比,所提控制图有着更为稳健和优越的在线监控表现。紧接着我们将目光转向高维数据流的异常诊断问题。我们首次将高维数据流的异常诊断问题开创性的构造成了一个大规模多重检验问题,并在多重检验的框架下提出了一个基于控制加权遗漏发现率的异常诊断方法来找到诊断子集,该子集在将加权遗漏发现率控制在给定水平α的同时,有着理论上最小的期望假阳性个数。我们对所提异常诊断方法的理论性质进行了系统的研究,并建立了其在控制加权遗漏发现率上的有效性和最优性。同时,数值结果显示所提出的异常诊断方法在各种情况下都要显著优于现有传统方法。接下来我们将动态隐患识别系统(Dynamic Screening System,DySS)拓展到了半参数领域。当动态系统的纵向行为符合半参数的特点时,我们将半参数纵向数据分析方法与指数加权移动平均(Exponentially weighted moving average,EWMA)监控方案有机的结合在一起,提出了一个新颖的半参数动态隐患识别系统来对有着不正常半参数纵向特征的个体进行在线监控。大量的模拟结果和一个在中风病人的总胆固醇水平在线监控中的应用显示所提控制图对于监控半参数纵向数据的漂移是非常有效的。最后,当profile数据中存在跳跃点时,我们首先提出了新颖的迭代跳跃点检测程序来估计跳跃点的位置和大小,并基于此提出了一个分段profile对齐程序来消除相位变异,最终通过同时监控跳跃点的位置和大小、对齐参数和对齐后的profile,将有用的信息有机的结合到了一起,提出了一个新的EWMA控制图来对带有跳跃点的profile数据进行在线监控。通过模拟结果和实际数据分析,本章发现与传统的profile控制图相比,所提控制图在监控带有跳跃点的profile数据时有着显著的优越性。