论文部分内容阅读
随着我国高速铁路的迅猛发展,高速铁路信号系统产生了海量的运营维护数据。高速铁路信号系统运营维护数据具有数据类型多、数据量大、增长速度快等典型的大数据特征。为利用大数据技术实现对高铁信号系统运营维护数据的分析和挖掘,需要对维护数据进行规范化处理。数据规范化处理的方法很多,其中通过引入哲学领域本体的概念语义Web,能够有效地实现计算机之间语义信息的共享。语义Web体系架构由世界万维网联盟(World Wide Web Consortium, W3C)提出,主要包括三个部分:一是基于SPARQL的资源描述框架(Resource Description Framework, RDF)数据的查询,二是基于描述逻辑的Web本体描述语言(Web Ontology Language, OWL)一致性检测的推理,三是基于语义Web规则语言(Semantic Web Rule Language, SWRL)的OWL本体规则的推理。本文在借鉴欧洲铁路运营维护数据处理经验的基础之上,利用语义Web技术并结合我国高铁运营维护数据的特点,针对高速铁路信号系统运营维护数据多源异构问题,提出了高铁信号系统异构数据融合和智能维护决策架构,并利用武汉-广州高速铁路2011~2012年的CRH-380A车载设备运营维护数据进行了验证。本文主要研究内容和研究成果包括以下三点:(1)针对高速铁路信号系统运营维护数据的大数据特征,提出了基于Hadoop的多源异构数据融合和智能维护决策支持的统一架构,为数据规范化和智能维护决策提供了有效的支撑和指导。(2)通过Hadoop的MapReduce实现本地数据库资源描述框架RDF(S))到全局RDF(S)的转换。转换过程利用基于霍尔逻辑的RDF(S)图的本体合并算法,实现了多源异构信息的融合。并通过本体建模工具Protege4.3构建CRH380A高铁信号系统车载设备运营维护数据的本体模型。(3)对经过处理得到的规范化数据,利用决策树经典的ID3算法并结合专家知识,构建了高铁信号系统的智能维护决策树(Decision Tree, DT)模型。并分别对基于霍尔逻辑的RDF(S)图的全局RDF(S)合并算法性能和故障诊断结果的准确性进行了分析对比,实验结果表明本文所提出的本体融合算法具有多项式级的计算复杂度,同时融合专家知识的智能维护DT决策模型的故障诊断准确率为95.23%。