论文部分内容阅读
射电数据是射电天文观测的结果,是进行射电天文学研究的核心基础。随着射电设备和观测技术的发展,新一代射电望远镜的涌现,射电天文学家获取天文观测数据的能力得到了空前的加强。射电天文的数据已经以一种实时、顺序、海量和无限的方式到达。如何对观测数据进行实时处理使得射电天文学家面对着前所未有的挑战。本文针对云南天文台40米射电望远镜脉冲星数字终端以及中国新一代厘米-分米波综合孔径望远镜即明安图射电频谱日像仪(MingantU SpEctral Radioheliograph,MUSER)的实时数据处理面临的问题开展研究,具体工作说明如下:(1)实时数据采集是天文数据实时处理流水线的起点,本研究分析了当前射电天文数据流传输的特点,针对传统Linux操作系统网络协议栈性能较低的问题,采用以内核旁路、零拷贝的用户态空间网络加速技术,实现了万兆以太网络下线速的无丢失的数据采集。该技术已成功应用于云台40米脉冲星的数字后端的数据采集。(2)近年来,图像处理单元(Graphics Processing Unit,GPU)技术得到了快速的发展,由于优异的浮点运算性能和较好的性价比,天文海量数据的实时数据处理除了采用传统的专用硬件芯片、中央处理器解决方案外,采用GPU用于实时数据处理已经成为必然的趋势。本文设计了一个基于GPU的天文海量数据处理的实时计算框架,将该计算框架应用于相干消色散的实时数据处理。实现了解码、转置、傅里叶变换、消色散、分通道、逆傅里叶变换、偏振检测、折叠、消噪、归档输出等数据处理模块,并在40米望远镜上进行了试观测。此外,针对40米望远镜脉冲星观测面临的射频干扰问题,根据观测信号中脉冲星信号和干扰信号的分布特点,利用独立成分分析对混合信号进行分解,分解出独立的射频干扰信号和脉冲星信号,消除射频干扰信号。(3)实时处理需要充分利用所有的计算资源,在异构环境下实现天文计算软件的无缝运行和快速迁移,能够提高计算资源的利用效率。本文对OpenCL技术实现异构环境下实时天文数据处理的可用性进行了研究,并在此基础上实现了 MUSER的射电干涉阵成像网格化算法和洁化算法,在保证了算法运行效率基本不变的基础上,其硬件不再限制于NVIDIA的GPU环境,为异构环境下实时数据并行处理进一步提供了扩展性。(4)采用分布式系统在集群上实时处理数据处理水平扩展计算能力也是一个主要研究内容。为了提高分布式实时计算环境的弹性部署和自动扩展的效率,本文研究了基于轻量级容器Docker技术的天文实时处理集群敏捷化构建与部署,并使用容器技术封装MUSER现有系统,在不同硬件模式下与物理机和其他虚拟机技术上的封装进行性能测试比较。论文研究了目前海量天文数据实时处理的若干问题,实际应用性较强。基于用户空间态的数据采集技术可应用数字终端前后端的超高IO的数据通讯。利用GPU和OpenCL构建的异构计算平台下可为实时数据处理提供加速。轻量级容器的虚拟化,可用于实时计算集群的灵活部署和扩展。本文研究内容为天文数据的实时处理提供了参考,为下一步相关工作打下了良好的基础。