论文部分内容阅读
变点检测针对的是随机过程状态的变化检测,这里的变点对应于数据流概率分布发生变化的时刻,决策者需要根据序贯观测的数据来实时判断数据流的概率分布是否发生变化。当变点后数据流的概率分布有多个可能时,我们还需要进一步诊断出其变点后概率分布类型。随着现代传感器技术与计算机技术的快速发展,人们可以同时获取不同领域或者不同空间许多传感器的实时数据,因此将不再是单一数据流下的变点检测与诊断问题,而是扩展到多数据流下的变点检测与诊断问题。本文主要对于并行数据流中的变点检测与诊断问题进行研究与分析。每条数据流都有其各自的变点,对应于每条数据流的概率分布发生变化的时刻,而决策者需要并行序贯的给出哪些数据流的概率分布已经发生了变化,即检测出变点。对于并行数据流中的多变点检测与诊断问题,传统的单数据流中的变点检测与诊断问题的相关性能衡量标准已无法应用于多数据流场景中。因此,我们创造性地将多数据流并行假设检验里的错误度量准则——错误发现率(FDR),即所有宣称发现变点的数据流数目中的提前错误检测到变点的数据流数目所占的期望比例,应用到我们研究的问题中。我们基于单数据流变点检测理论的相关结果,给出了提出的并行数据流中决策算法的性能分析,证明了其错误检测性能的可控性,以及对于大规模数据流的可扩展性。此外,对于单数据流变点检测与诊断问题,我们给出了一种新的贝叶斯决策算法的渐近最优性分析。本文的主要贡献如下:1)我们从非贝叶斯和贝叶斯角度出发,分别研究了并行数据流中多变点检测问题。非贝叶斯场景下,我们建立了非贝叶斯多变点模型,提出一个基于FDR控制的序贯决策算法用以检测出所有有限变点。对于基于FDR控制的决策算法,证明了其FDR可控性,并且得到了平均检测延迟(ADD)的渐近表现,即不随数据流数目增长而变化;相反的是,基于总体错误率(FWER)控制的决策算法的ADD随着数据流数目的增大而呈对数增长。通过数值仿真验证了理论分析结果。在贝叶斯场景下,建立了对应的贝叶斯采样受限多变点模型,将FDR度量准则延伸到这一问题中,并且提出一个采样受限的贝叶斯序贯决策算法用以检测出所有变点。建立了相应决策算法的FDR性能保证,以及整体平均检测延迟的渐近分析结果,结果表明基于FDR控制的决策算法其整体平均检测延迟性能要远优于FWER控制算法,对于大规模数据具有可扩展性。最后我们给出了一个具体应用实例,将贝叶斯下采样受限的序贯决策算法用于认知无线电中的多通道动态频谱接入问题,进一步阐释了基于FDR控制的序贯决策算法的实际应用。2)将多变点检测问题延伸为多变点检测与诊断问题,建立了贝叶斯场景下的并行数据流多变点检测与诊断模型,在最大采样限定条件下,将FDR度量标准用于多变点检测与诊断问题中,提出采样受限下的序贯多变点检测与诊断算法用以检测出所有有限变点并给出变点后概率分布的正确类型。借助单数据流中的变点检测与诊断的有关理论结果,我们证明了该多变点检测与诊断算法的FDR可控性,并且给出了对应的整体平均正确检测延迟的渐近结果。利用数据仿真我们探究了模型中不同参数对检测与诊断算法性能的影响,并且进行具体案例分析,采用实际生活中股票价格的时间序列来检验多变点检测与诊断算法的性能,进一步证实我们提出的决策算法的实际可行性。3)在并行数据流多变点检测与诊断问题中,由于采用的决策算法并没有利用已有的变点先验分布知识,我们认为对于贝叶斯下的变点检测与诊断问题应该将已有的变点先验分布知识利用进来找出性能更好的决策算法。因此,我们建立了变点先验分布为任意分布下的贝叶斯变点检测与诊断模型,提出了新的最优性度量标准,给出了贝叶斯变点检测与诊断算法,推导了其全局虚警概率和错误诊断概率的上界,以及平均检测延迟的渐近上界。同时,推导出了满足提出的错误度量准则所有决策算法的平均检测延迟的渐近下界,进而证明了我们提出的决策算法在满足一定条件下的渐近最优性。