论文部分内容阅读
随着科学技术和我国交通运输业的发展,高速列车的运行速度也随之不断提高,因此,对列车运营的安全性也有了更高的要求。高速列车故障诊断是保证列车运行安全的重要工具,通过实时分析高速列车数据来获取异常信息,从而实现对高速列车故障的定位,避免或减少事故的发生,在高速列车运行安全性、可靠性等方面具有重要意义。本文依托国家自然科学基金重大项目课题“基于大数据和知识的高速列车信息控制系统故障建模理论与方法”开展研究,提出了面向实时故障诊断的高速列车轴温数据分析系统。本文的主要研究工作如下:(1)研究了国内外现有的故障诊断系统,进行了高速列车的故障诊断系统和大数据分析平台架构的现状的调研。由于高速列车数据具有明显的大数据特征,即:数据量大、种类繁多、价值密度低、实时性强,因此,高速列车故障诊断系统既要支持大规模数据的分析又要满足实时性要求。由于目前缺乏针对高速列车大规模数据进行实时故障诊断的分析系统,因此,本文提出了一种面向实时故障诊断的高速列车轴温数据分析系统。本文从高速列车数据流向的角度,对系统的功能需求进行了详细分析,主要从数据分析需求、数据传输的需求、数据存储的需求三个方面对系统进行了需求分析。(2)根据需求分析对系统进行设计。按照模块化的设计原则完成了面向实时故障诊断的高速列车轴温数据分析系统架构的设计。该系统主要包括以下几个功能模块:数据采集模块、数据传输模块、数据预处理模块、数据存储模块、数据分析模块及数据可视化模块。其中,通过构建数据采集工具实现将高速列车数据加载到数据传输模块中,解决了数据的实时采集;通过构建消息队列实现数据的实时传输,解决了高速列车数据传输的实时性问题;通过构建数据预处理工具对高速列车数据进行清洗,解决了高速列车数据格式的问题;通过提出一种无损压缩方法实现对高速列车数据的高效压缩,大大减少了存储空间,解决了高速列车大规模数据占用大量空间的问题;通过构建分布式数据库实现了大规模高速列车数据的存储问题;通过部署实时数据分析引擎解决了高速列车数据的实时性分析问题;通过数据可视化工具解决了高速高速列车数据的可视化问题。因此,通过本系统对高速列车数据进行实时分析从而实现对高速列车进行实时故障诊断。(3)按照设计方案,以流程工业综合自动化国家重点实验室工业云平台为基础,采用Java开发语言、MySQL数据库、大数据处理框架如Hadoop,Zookeeper,Rabbitmq,Storm,HBase以及可视化软件Tableau Desktop完成了系统的开发。其中,Hadoop用来做基础架构,主要利用其分布式文件系统HDFS来存储高速列车产生的数据文件,解决了高速列车运行过程中产生的大规模数据文件的存储问题;Zookeeper用来做资源协调,同时用来存储Storm及Rabbitmq的一些元数据信息,实现了该分析系统的可靠性;Rabbitmq用来将高速列车数据进行实时传输,解决了高速列车数据传输的实时性问题;Storm用来对高速列车数据进行实时分析,解决了高速列车数据分析的实时性问题;HBase用来存储高速列车历史数据及压缩后的历史数据,解决了大规模高速列车历史数据的存储问题;MySQL用来存储高速列车实时数据及数据分析模块的结果数据,和作为数据可视化模块的数据源,减少了将高速列车数据进行可视化的复杂性;Tableau Desktop用来将数据进行可视化,解决了高速列车数据的可视化问题,可以更好的帮助列车员进行故障预警。(4)该系统在流程工业综合自动化国家重点实验室工业云计算中心进行部署,并对面向实时故障诊断的高速列车轴温数据分析系统的各个功能模块分别进行了实验验证。实验结果表明该本文提出的面向实时故障诊断的高速列车轴温数据分析系统实现了高速列车数据的实时采集、实时传输、大规模数据的存储、高速列车数据的可视化及高速列车的实时预警和报警。实验结果表明系统满足实时性要求,又由于系统本身支持大规模数据的特点,因此,达到了系统设计的目的。