一种集成学习算法及其对灰霾预测的应用研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:xinwang01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集成学习,是先将样本提供给多个学习模型,再采取投票或是级联等方法把这些学习模型的输出集成起来的学习模型。集成学习采用合成多个学习模型的输出,能够显著的提高学习模型的泛化能力。   本文主要是对异质集成算法的研究,通过对异质集成算法的深入分析,提出一种泛化能力好的新型异质集成算法,并对新提出的算法进行理论分析和实验检验。   本文的主要工作和创新点如下:   (1)提出了一种新的异质混合集成算法。   个体学习器训练子集生成方面:在提取训练子集的过程中基于Bagging技术,从原始训练集中重复选取。为了增强各个训练子集的独立性,采用随机子空间法来提取训练子集。   个体学习器模型选择方而:采用决策树和神经网络混合的方式来训练个体学习器。由于决策树和神经网络等模型易于陷入空间局部最小,因此容易产生差异较大的个体学习器。   结论集成方面:采用支持向量机来对个体学习器的结论进行集成。支持向量机在防止过度拟合、运算速度和结果精度等方面表现出明显的优越性。本文将每个个体学习器的输出结论作为一维特征,用所有个体学习器的输出结论组成新的数据集,最后使用支持向量机在新的数据集上进行学习和预测。   (2)对新提出的异质混合集成算法给出泛化误差和个体学习器差异度的数学模型,并依据提出的数学模型指导算法的参数优化。   (3)采用此算法进行了灰霾预测实验。选取济南市2011年1月、4月、7月和10月二十四小时气象和污染物排放的实测和预测数据作为实验数据,用本文提出的数学模型指导算法的参数设置,在采用本文提出的算法对济南市的灰霾预测实验中,取得了理想的预测精度。对比实验表明,本文提出的异质混合集成算法的预测精度明显好于神经网络、决策树和AdaBoost.M1。
其他文献
随着互联网的发展,社交网络发展迅速,尤其是移动社交网络随着用户数目的增加而备受人们关注。然而,当前的移动社交网络中还存在着一些不足。现在的移动社交网络只是支持好友之间
支持向量机(SVM)具有理论基础完备、所需训练样本数目少、泛化能力强等优点,已经在文本分类、人脸图像识别、手写数字识别、语音识别、生物信息学等模式识别领域中获得广泛应
网络图中的motif是一种连通的导出子图,并且满足在原图中出现的次数比它在随机图中出现的次数多很多。这种性质可以解释成这种子图在原图中扮演了比在任意的随机图中更加重要
随着多媒体技术的迅速发展以及互联网的普及,数字图像广泛应用于日常生活和工作中,与此同时图像编辑处理工具Photoshop、ACDSee等的迅速发展,使得编辑图像内容变得越来越简单。
在教学实验中直接使用CoreABC指令集系统进行代码编程,对于初步接触数字电路的学生而言是有一定难度的,从而造成难以完成实验目标以及理解CoreABC微控制系统。如果用标准C语
作为组合优化领域与计算机科学中的一个重要分支,装箱问题越来越受到人们的关注与重视。随着科技的发展,组合优化问题在生活中的应用越来频繁,装箱问题的研究得到了飞速的发展,并
随着工作流技术广泛应用于生物信息学实验,其整合分析工具完成复杂生物计算的能力越来越受到人们关注。生物信息工作流通过一种模块化的流程表达方式形象地描述计算分析的过程
近年来,科学技术迅猛发展,信息技术已经渗入社会、经济、生活等各个领域,但信息技术是一把双刃剑,一方面它的便捷性和全球性对经济的发展起到有力的推动作用,另一方面,其自身的缺陷
背包问题在众多工业领域中都能遇到,诸如交通、物流、切割及包装、电信、可靠性、广告、投资、预算分配和生产管理。在这些应用中,背包问题一般作为独立的问题或复杂的子问题出
在软件管理系统中,数据大部分存储在传统的关系型数据库中,但当业务复杂度的提高和数据量的不断增加,简单的通过单一节点的数据库处理方式已经无法满足用户对于希望快速获取反馈