基于大规模光变曲线预测模型的精度优化方法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:wutiepeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在天文学领域中,重大的天文事件往往伴随着光变曲线亮度值的突变,因此,通过对光变曲线分析可以更好地捕捉重大的天文事件。本文的主要目标是通过对天体的光变曲线进行预测和异常分析,实现异常天文事件的预警工作,提高天文观测问题处理的实时性以及全面性。更进一步地推动超新星的发现及时并准确地探测微引力透镜和伽玛射线暴等一系列重大的天文学问题,促进天文学大数据的发展。目前,针对光变曲线序列的预测任务还停留在统计学方法的阶段。在面临时间采样频率为15s,每时每刻有数以百计数据产生的大规模天文数据时,无法有效的保证预测精度以及预测时间效率。同时,由于高采样频率下的天体数据会引入大量的干扰噪声,不利于分析建模;在模型自身方面,传统的统计学和机器学习技术无法捕捉到时间维度上的长期依赖现象,无法达到适应数据分布和准确预测的效果;最后,在光变曲线异常检测方面需要人为规定阈值,受主观性影响较为严重,缺乏适应性的检测方法,异常检测无法达到高鲁棒性。为了解决光变曲线时间序列分析中存在的数据量大、采样频率高、预测精度不够、异常检测鲁棒性低的问题,本文提出了基于循环神经网络的光变曲线预测模型和基于卷积神经网络的异常检测方法。研究的光变曲线是天文学上表示天体相对于时间亮度变化的图形,模型当中采用的数据为中法合作的伽玛射线暴探测天文卫星的Mini-GWAC拍摄到的图像,在进行点源提取与交叉证认后得到光变曲线数据。数据提取方式是对于同一颗星体连续获得的多天光变数据,按照先后顺序连接起来构成数据流进行预测分析。研究的主要问题和内容包括光变曲线的预测和异常检测,具体如下:(1)基于序列分解的LSTM神经网络的光变曲线预测方法:主要是对现有预测模型的精度进行优化,达到模型对特定天区的光变曲线的拟合,使得预测更准确和快速。主要采用的预测模型是基于EMD分解的LSTM预测模型,基于EMD的时频分析方法可以应用于任何类型的信号的分解,在处理非平稳及非线性数据上,具有非常明显的优势和很高的信噪比。而LSTM是一种针对时序数据建模效果最完善的算法,通过循环反馈连接保留之前时刻的信息,使得整个模型能够捕捉长期序列信息。与此同时,搭建ARIMA、MLP、SVR、普通RNN和GRU多种模型进行对比实验,验证本文提出的预测模型的预测精度和效果。(2)在此基础上,实现光变曲线的异常检测任务,本文提出一种基于谱残差(Spectral Residual,SR)数据变换和卷积神经网络(Convolutional Neural Network,CNN)的光变曲线异常检测方法,将CNN直接应用于SR模型的输出数据中,利用CNN学习一个判别规则,缓解原始SR方法的单一阈值问题。在异常检测中,我们的目标是探测短时间尺度的天文异常,并提供预警,这里着重于研究微引力透镜的异常检测任务。利用深度学习的方法适应非静态数据,使得异常检测模型不再对原始的数据分布进行明确要求和界定,相对于传统的统计学方法表现出优异的精度和鲁棒性。
其他文献
随着世界经济的蓬勃发展和科学技术的腾飞,传统的集中式发电难以满足用户电力需求,因此,微电网技术开始得到了广泛的发展和应用。目前建设的微电网项目已经不仅只能给用户提供电力服务,还能够依据用户所在地的自然资源禀赋,把当地的风能、光能等新能源和一次能源转换为电能、热能和风能供居民使用,还能够将剩余不同形式的能源储存留用,实现新能源的就地消纳,提高了资源的合理配置,满足用户的用电用冷用热需求。因此,在推广
先秦法家学派作为先秦诸子中重要的一支思想流派,其内核是构成中国文化不可忽略的因素,在中国全面深化改革进入深水期的今天,公民道德滑坡所带来的道德困境问题日益成为社会的焦点话题,失德行为的出现与社会的风云激荡使得原本深入人心的道德教化无法满足现代人对于道德困境的困惑解答,在道德呼吁收效甚微和无力触及的领域,国人亟待用一种新的视角缓解道德困境问题,被忽略已久的先秦法家学派也得以重新回到人们的视野中,将先
电力电子变压器(PET)的技术革新一直以来都是电力行业中的一项热门课题。传统电网系统使用的工频电压器智能体系不足、体积巨大、缺少直流变化接口等问题,直接引起了国内外学
道路建设及发展在全国乃至全世界的交通基础设施中都占据着举足轻重的地位。然而在道路的使用过程中,不可避免地出现各种破损、坍塌和变形等病害,给社会经济和交通安全带来威胁和损失。而这些病害都与裂缝相关,由于裂缝的成因、形状以及类型的不同,对路面结构的危害性也有很大的区别。因此,裂缝的检测和识别成为了一个热点研究问题,尤其是在图像处理和机器学习等信息技术高速发展的背景下,基于图像特征的裂缝提取就成为了工程
随着中国医疗体制改革推广和全民医疗保健意识提升,医疗器械行业呈现增长态势。但伴随全球竞争,在买方市场为主的行业内,医疗器械企业只得以赊销提高销售、扩大市场,带来较高
随着信息技术与工业制造的深度融合,设备运行过程中不断产生的海量状态数据被保留下来,使利用大数据分析的方法对设备故障进行有效识别和预测逐渐成为故障诊断领域的主流。但
当前中国处于经济转型以及经济增速换挡的大背景下,定向增发由于在当前的再融资手段中具有审批迅速、审查指标相对宽松的优势,是产业结构转型的重要融资工具,因此自2014年以
果蝇算法已经广泛应用于生活中的不同领域,本文将其应用于财务领域。尽管果蝇算法本身具有一定的全局优化能力,但果蝇算法在某些寻优过程中仍易出现局部最优、精度降低等问题
现代公司是以所有权和经营权相分离为基本特征的,这使得公司内部存在着多种委托-代理关系,而在信息不对称、合同不完全、市场不确定性等条件下,易出现代理人机会主义行为。现
研究目的:运动员身体机能状态是影响其竞技能力的重要因素。本文将对国家现代五项队女子运动员冬训训练期间的生理生化指标进行测试,并进行深层次分析研究,真实地反映我国现