论文部分内容阅读
在天文学领域中,重大的天文事件往往伴随着光变曲线亮度值的突变,因此,通过对光变曲线分析可以更好地捕捉重大的天文事件。本文的主要目标是通过对天体的光变曲线进行预测和异常分析,实现异常天文事件的预警工作,提高天文观测问题处理的实时性以及全面性。更进一步地推动超新星的发现及时并准确地探测微引力透镜和伽玛射线暴等一系列重大的天文学问题,促进天文学大数据的发展。目前,针对光变曲线序列的预测任务还停留在统计学方法的阶段。在面临时间采样频率为15s,每时每刻有数以百计数据产生的大规模天文数据时,无法有效的保证预测精度以及预测时间效率。同时,由于高采样频率下的天体数据会引入大量的干扰噪声,不利于分析建模;在模型自身方面,传统的统计学和机器学习技术无法捕捉到时间维度上的长期依赖现象,无法达到适应数据分布和准确预测的效果;最后,在光变曲线异常检测方面需要人为规定阈值,受主观性影响较为严重,缺乏适应性的检测方法,异常检测无法达到高鲁棒性。为了解决光变曲线时间序列分析中存在的数据量大、采样频率高、预测精度不够、异常检测鲁棒性低的问题,本文提出了基于循环神经网络的光变曲线预测模型和基于卷积神经网络的异常检测方法。研究的光变曲线是天文学上表示天体相对于时间亮度变化的图形,模型当中采用的数据为中法合作的伽玛射线暴探测天文卫星的Mini-GWAC拍摄到的图像,在进行点源提取与交叉证认后得到光变曲线数据。数据提取方式是对于同一颗星体连续获得的多天光变数据,按照先后顺序连接起来构成数据流进行预测分析。研究的主要问题和内容包括光变曲线的预测和异常检测,具体如下:(1)基于序列分解的LSTM神经网络的光变曲线预测方法:主要是对现有预测模型的精度进行优化,达到模型对特定天区的光变曲线的拟合,使得预测更准确和快速。主要采用的预测模型是基于EMD分解的LSTM预测模型,基于EMD的时频分析方法可以应用于任何类型的信号的分解,在处理非平稳及非线性数据上,具有非常明显的优势和很高的信噪比。而LSTM是一种针对时序数据建模效果最完善的算法,通过循环反馈连接保留之前时刻的信息,使得整个模型能够捕捉长期序列信息。与此同时,搭建ARIMA、MLP、SVR、普通RNN和GRU多种模型进行对比实验,验证本文提出的预测模型的预测精度和效果。(2)在此基础上,实现光变曲线的异常检测任务,本文提出一种基于谱残差(Spectral Residual,SR)数据变换和卷积神经网络(Convolutional Neural Network,CNN)的光变曲线异常检测方法,将CNN直接应用于SR模型的输出数据中,利用CNN学习一个判别规则,缓解原始SR方法的单一阈值问题。在异常检测中,我们的目标是探测短时间尺度的天文异常,并提供预警,这里着重于研究微引力透镜的异常检测任务。利用深度学习的方法适应非静态数据,使得异常检测模型不再对原始的数据分布进行明确要求和界定,相对于传统的统计学方法表现出优异的精度和鲁棒性。