变点检测与诊断及其在并行数据流中的应用研究

来源 :中国科学技术大学 | 被引量 : 2次 | 上传用户:seaflower0000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
变点检测针对的是随机过程状态的变化检测,这里的变点对应于数据流概率分布发生变化的时刻,决策者需要根据序贯观测的数据来实时判断数据流的概率分布是否发生变化。当变点后数据流的概率分布有多个可能时,我们还需要进一步诊断出其变点后概率分布类型。随着现代传感器技术与计算机技术的快速发展,人们可以同时获取不同领域或者不同空间许多传感器的实时数据,因此将不再是单一数据流下的变点检测与诊断问题,而是扩展到多数据流下的变点检测与诊断问题。本文主要对于并行数据流中的变点检测与诊断问题进行研究与分析。每条数据流都有其各自的变点,对应于每条数据流的概率分布发生变化的时刻,而决策者需要并行序贯的给出哪些数据流的概率分布已经发生了变化,即检测出变点。对于并行数据流中的多变点检测与诊断问题,传统的单数据流中的变点检测与诊断问题的相关性能衡量标准已无法应用于多数据流场景中。因此,我们创造性地将多数据流并行假设检验里的错误度量准则——错误发现率(FDR),即所有宣称发现变点的数据流数目中的提前错误检测到变点的数据流数目所占的期望比例,应用到我们研究的问题中。我们基于单数据流变点检测理论的相关结果,给出了提出的并行数据流中决策算法的性能分析,证明了其错误检测性能的可控性,以及对于大规模数据流的可扩展性。此外,对于单数据流变点检测与诊断问题,我们给出了一种新的贝叶斯决策算法的渐近最优性分析。本文的主要贡献如下:1)我们从非贝叶斯和贝叶斯角度出发,分别研究了并行数据流中多变点检测问题。非贝叶斯场景下,我们建立了非贝叶斯多变点模型,提出一个基于FDR控制的序贯决策算法用以检测出所有有限变点。对于基于FDR控制的决策算法,证明了其FDR可控性,并且得到了平均检测延迟(ADD)的渐近表现,即不随数据流数目增长而变化;相反的是,基于总体错误率(FWER)控制的决策算法的ADD随着数据流数目的增大而呈对数增长。通过数值仿真验证了理论分析结果。在贝叶斯场景下,建立了对应的贝叶斯采样受限多变点模型,将FDR度量准则延伸到这一问题中,并且提出一个采样受限的贝叶斯序贯决策算法用以检测出所有变点。建立了相应决策算法的FDR性能保证,以及整体平均检测延迟的渐近分析结果,结果表明基于FDR控制的决策算法其整体平均检测延迟性能要远优于FWER控制算法,对于大规模数据具有可扩展性。最后我们给出了一个具体应用实例,将贝叶斯下采样受限的序贯决策算法用于认知无线电中的多通道动态频谱接入问题,进一步阐释了基于FDR控制的序贯决策算法的实际应用。2)将多变点检测问题延伸为多变点检测与诊断问题,建立了贝叶斯场景下的并行数据流多变点检测与诊断模型,在最大采样限定条件下,将FDR度量标准用于多变点检测与诊断问题中,提出采样受限下的序贯多变点检测与诊断算法用以检测出所有有限变点并给出变点后概率分布的正确类型。借助单数据流中的变点检测与诊断的有关理论结果,我们证明了该多变点检测与诊断算法的FDR可控性,并且给出了对应的整体平均正确检测延迟的渐近结果。利用数据仿真我们探究了模型中不同参数对检测与诊断算法性能的影响,并且进行具体案例分析,采用实际生活中股票价格的时间序列来检验多变点检测与诊断算法的性能,进一步证实我们提出的决策算法的实际可行性。3)在并行数据流多变点检测与诊断问题中,由于采用的决策算法并没有利用已有的变点先验分布知识,我们认为对于贝叶斯下的变点检测与诊断问题应该将已有的变点先验分布知识利用进来找出性能更好的决策算法。因此,我们建立了变点先验分布为任意分布下的贝叶斯变点检测与诊断模型,提出了新的最优性度量标准,给出了贝叶斯变点检测与诊断算法,推导了其全局虚警概率和错误诊断概率的上界,以及平均检测延迟的渐近上界。同时,推导出了满足提出的错误度量准则所有决策算法的平均检测延迟的渐近下界,进而证明了我们提出的决策算法在满足一定条件下的渐近最优性。
其他文献
[研究背景]软骨作为一种单一细胞成分的结缔组织,由单一的软骨细胞、纤维以及基质构成,在体内主要发挥着连接、支持、分散应力以及减少振荡等生理功能。然而,创伤、炎症以及
拓跋鲜卑在中华民族历史上曾经起过重要作用,它结束了北方十六国纷争的局面,统一了中国北方的广大地区,创立了北方民族融合的典范,奠定了隋唐统一国家形成的基础。然而,由于
本文是在KUKA KR210六自由度机器手臂的基础上,设计一款具备锯切和水刀切割双重功能的石材复合切割机器人系统,叙述了整个系统的工作原理。并对复合切割机器人的视觉系统进行
2008年国际金融危机爆发以后,由于内外需大幅减弱,中国的钢铁、水泥、电解铝等行业产能过剩问题凸显出来。本文从如何看待产能过剩现象入手,分析了当前中国产能过剩的现状、
针对高斯白噪声信道下传统信噪比(Signal to Noise Ratio,SNR)估计算法适用的相位键控(PSK)调制阶数低、信噪比估计过程中数值计算系数大的问题,提出了一种新的8PSK信号盲信
由于历史原因、政治因素及地域的差异,彝族支系繁多,服饰差异大,同一片区的彝族服饰就有较大的差异,有些地区语言相通,服饰却完全不同,琳琅满目,精美异常,各具特色。本文主要
分析了宽带数字接收机AGC设计所需考虑的问题及相关因素,提出了宽带数字接收机AGC设计的通用方法,解决了接收机的瞬时动态范围压缩和发生阻塞干扰的矛盾,为宽带数字接收机在
由外伤、肿瘤、感染等疾病因素造成的骨缺损在临床工作者日益多见,严重影响患者的身心健康和生活质量。目前临床首选的治疗方案仍是自体骨或异体骨移植,但存在来源有限,供体
[目的]基于MiSeq二代测序平台构建一个高通量Y-STR遗传标记复合检测体系,进行江苏汉族人群的Y-STR遗传多态性研究,获得各Y-STR基因座的序列多态性、相关群体遗传和法医学参数
<正> "德国新电影运动"的主将之一、著名导演法斯宾德从一九六九年开始电影创作到一九八二年去世,一共执导了四十多部电影,是"德国新电影运动"另外三位导演的电影作品的总和