数据挖掘在航空安全自愿报告分析中的应用研究

来源 :中国民航大学 | 被引量 : 0次 | 上传用户:vivien2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
航空安全自愿报告是由民航从业人员自愿提供的一种信息报告,主要记录该报告人员经历的民航安全隐患事件过程,其形式包括结构化数据(事件发生地点、时间、航空器类型、航空公司类型、飞行过程等)和非结构化数据(事件经过的简要描述);数据挖掘旨在从大量的、不完全的、有噪声的数据中,自动提取隐含在其中的模式和知识。论文以"航空安全自愿报告系统"中收集的事件报告为数据源,主要研究数据挖掘在自愿报告分析中的应用,针对自愿报告特有的结构化数据和非结构化数据共存的现状,研究如何借助数据挖掘技术自动识别隐藏在数据中未知的、潜在的问题,揭示事故发展的趋势和关联,以期高效进行安全事件数据分析,控制和消除航空安全隐患,提高飞行安全性能。 论文在对数据挖掘技术(关联规则挖掘,文本检索,聚类等)及我国的航空安全自愿报告进行系统和深入探讨研究的基础上,主要做了以下工作:1.针对我国航空安全自愿报告的数据形式进行实验分析,采用数据清洗、数据集成、数据归约等技术对数据进行必要的预处理:2.采用哈希表及数据划分技术对Apriori算法进行改进,并对其进行多维关联规则挖掘适应性改进,最终采用此算法对航空安全自愿报告结构化部分进行关联分析,挖掘其中隐藏的关联规则;3.采用关注词集合技术表征自愿报告特征,分别采用欧氏距离和余弦距离两种方式度量报告相似度,实现了航空安全自愿报告的相似检索;4.采用模糊聚类方法对航空安全自愿报告非结构化部分进行报告的自动聚类;5.针对我国航空安全自愿报告专有数据形式,提出了不同数据挖掘技术在航空安全自愿报告分析中的综合应用策略,并给出了实验结果及分析。 论文分别给出了不同数据挖掘方法和技术在用于航空安全自愿报告分析时的实验结果。实验表明:从航空安全自愿报告中可以挖掘出隐含的有效航空安全关联规则;报告的聚类及相似报告检索有助于分析人员聚焦分析相关报告之间的实质联系,就所选数据源而言,采用余弦距离比欧氏距离聚类效果更好;多种数据挖掘技术在航空安全自愿报告的综合应用能更有效地挖掘安全信息,这将是航空安全自愿报告分析研究的一个趋势。
其他文献
Web-GIS是当前GIS发展中的一个热点,它是利用互联网技术来扩展和完善地理信息系统的一项新技术,其核心是在地理信息系统中嵌入HTTP和TCP/IP标准的应用体系,实现互联网环境下的空
在对实际应用领域进行知识发现的过程中,由于数据采集能力有限和数据存储介质损坏等未知情况,所获取用于挖掘的数据系统往往是不完备的,即存在缺失数据。因为这种数据的不完备性
柴油机是多种水面舰艇和军辅船的主要动力装置,是舰船的心脏,一旦发生故障将会导致舰船不能正常运行甚至瘫痪。柴油机是一种复杂的机械,包含的系统部件比较多,产生故障的原因错综
随着航空产品的复杂程度和现代化程度的不断提高,其日益依赖于先进的试验与测试手段。计算机网络技术与分布式处理技术的发展,为研究先进的实时分布式机载测试系统提供了良好
随着电信市场的逐步开发,竞争日趋激烈,电信运营商的经营模式逐渐从“技术驱动”向“市场驱动”、“客户驱动”转化。这就要求运营商要采取以“客户为中心”的策略,根据客户的实
随着计算机技术和网络技术的飞速发展,计算机和网络已经渗透到社会生活的方方面面。随之而来的网络安全问题也越来越引起人们的关注和重视。入侵检测系统是一种软件与硬件的
Internet技术的迅速发展使得网络逐渐成为人们获取知识的主要途径之一。近年来,E-learning的研究和应用领域飞速发展,为用户提供了前所未有的丰富的学习资源和灵活的学习方式。
软件需求阶段引入的错误,为之付出的成本通常都比较高,因为它的影响会持续到后续的设计、开发和测试等多个阶段,所以在需求文档提交之前,需求验证是非常重要的一步工作。本文的研
电子政务是政府在国民经济和社会信息化的背景下,以提高政府办公效率,增加透明度,改善决策和投资环境,强化经济和社会的有效管理,提高法制治理水平为目标,将政府的信息发布、管理、
随着网络技术的发展和各种网络服务迅猛发展,各种IP网络服务也随之得到飞速发展,这些网络服务的发展离不开网络计费系统的支持。计费是网络提供商获取报酬的最主要最为直接最