论文部分内容阅读
道岔转辙机作为铁路信号系统的重要基础设备,是轨道的薄弱环节之一,对铁路列车行车安全与运输效率有决定性意义。目前,各铁路运营单位、设备制造商都积累了大量道岔监测数据,业内学者围绕如何利用道岔监测数据准确评价线路设备状态,预测设备故障等问题做了许多研究,但是在数据可视化研究方面显得不足,大多数直接利用简单图表展示出监测数据的简单时间序列关系,缺乏对历史数据的分析。可视化展现道岔设备的历史状态信息,能够为道岔设备故障分析、维修养护决策提供重要参考。聚类分析作为一种无监督学习,可以在不清楚道岔监测数据故障种类的情况下,表达出异常数据与其他正常数据的差异。在实际中,道岔工作状态受内部、外部环境等多因素影响而可能产生新的故障类型,通过聚类分析也能够将其反映出来。论文的主要工作如下:第一,通过散点图直观反映数据在空间的分布情况,从而在宏观角度了解道岔监测数据的整体情况。利用聚类算法K-means可以快速实现道岔监测数据的散点图,而K-means算法存在缺陷易对聚类结果产生影响。本文深入研究K-means算法并对不足之处进行改进,针对如何在聚类前确定聚类数目K这一问题,提出了基于四分位数和局部密度的改进算法;针对如何确定初始聚类中心这一问题,提出了基于球哈希算法的改进算法。此外分别对两种改进算法进行实验分析,利用UCI知识集对算法进行对比,并证明了本文改进算法的有效性。第二,提出了基于高阶累积量的道岔监测数据特征提取方法,并通过实验分析证明了利用高阶累积量的特征提取方法相较于传统方法、FrFT方法和DWT方法的优越性。第三,采用分段统计的方法提取特征并将其可视化,详细分析了特征变化趋势及其原因。从宏观角度出发,利用改进算法进行基于四阶累积量的道岔监测数据聚类可视化,在整体上了解监测数据的分布情况,还将异常数据与监测日志数据对应起来;从微观角度出发,提出了基于调整余弦相似度的道岔工作状态评价方案,并对全部道岔的状态进行了统计分析。最后总结了道岔状态影响因素,并着重就天气因素进行相关分析。