论文部分内容阅读
近年来,煤矿瓦斯安全生产事故频发,特别是随着开采深度的加大导致开采条件更趋复杂,瓦斯灾害的威胁越加严重,煤矿瓦斯安全生产事故已然成为煤炭行业可持续发展的制约因素,现有的安全技术基础及管理已难以适应当前煤矿安全高效生产的迫切需求。因此,如何减少和防止瓦斯安全事故的发生,科学、系统地查除矿井瓦斯事故隐患和开展矿井瓦斯危险性的演化机制分析及预测,摆脱瓦斯事故带来的不利安全局面,是值得深入研究的课题。论文以国家自然科学基金为依托,以煤矿具体项目为实际应用背景,对半监督学习算法及其在煤矿瓦斯安全信息处理中的应用进行了深入研究。本文研究工作主要包括以下四个方面:1.针对煤矿瓦斯安全数据的高维特性导致智能算法效率低下的问题,提出了一个基于图的无参数维数约减算法。首先,给出了一种新的边界点定义方法,在所有非边界点和离他们各自最远的同类点上建立内在图,同时在所有边界点及它们各自的最近邻异类点上建立了惩罚图。通过一个新的判别准则将问题转化为一个广义特征分解问题,通过求解得到从原始空间到低维空间的一个显式映射。该算法避免了传统基于图的维数约减算法中近邻参数的选择,实验表明在降低了复杂度的同时,该算法仍能保持较好的维数约减效果。2.随着煤矿信息化的建设,海量的数据不断地出现在信息化平台上,采用监督式学习算法进行处理时就要求具有专业领域知识的人员耗费大量的精力进行标注工作。针对这一问题,提出了一种局部保持的半监督维数约减算法,并针对非线性维数约减问题,给出了算法的核化扩展。该算法同时利用少量有标签的样本和大量无标签的样本进行学习,在低维子空间中保持了样本的鉴别关系和空间几何结构。在有标签样本较少的情况下,该算法也能够获得较好的泛化性能。3.瓦斯时间序列预测是进行煤矿瓦斯安全危险性评价的有效手段,煤矿瓦斯时间序列数据具有很高的时间相关性,但现有的多元时间序列半监督回归算法只考虑样本间空间关系信息而忽略了样本间时域信息。针对这一问题,提出了一种考虑样本间时域信息的半监督回归算法,在时域光滑性假设下,构造了一种能更好地反映样本间内蕴几何结构的正则化项。在建立图拉普拉斯的过程中,将样本点间的时序关系引入到边的权重计算中,并在流形正则化框架下加入该正则化项进行半监督回归。与只考虑样本空间关系信息的算法相比,该算法能同时利用样本的时空信息,预测准确率得到了提高。4.从模式分类的角度出发,利用煤矿瓦斯安全数据对工作面瓦斯安全危险性进行分类评价能够为煤矿瓦斯事故的预防提供可参考的依据。现有的多数半监督分类方法都是基于聚类假设与流形假设这两种假设中的一种进行学习,显然当某种假设不合适时,算法的性能就会下降。针对这一问题,提出一种新的渐进式半监督学习算法,该算法同时结合两种假设进行学习,利用无标签样本信息,通过重构核希尔伯特空间,构造了一种能够反映样本内在流形结构的半监督核,最后在支持向量机中利用该半监督核采用渐进式方式进行学习。算法结合了聚类假设和流形假设,因此可以避免当某一假设不适合时仅采用该单一假设所造成的算法效果差的现象。本文研究的内容涉及到了煤矿瓦斯数据维数约减、煤矿瓦斯时间序列回归和煤矿瓦斯数据分类三方面问题,主要采用了机器学习中半监督式学习方式。在研究了相关领域前期工作的基础上对已有的算法进行了分析和改进,提出了新的算法,使用人脸识别和数据挖掘研究中常用的公共数据集进行了实验,和相关算法进行了性能对比,验证了本文提出的算法的有效性,最后在煤矿瓦斯安全信息处理中对文中所提出的算法进行了应用。应用结果表明,本文的研究成果在煤矿瓦斯安全信息处理中取得了不错效果,对提高煤矿生产安全性具有一定的指导意义。