回归分析中的贝叶斯推断技术的研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:zgjcq1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
运用贝叶斯推断方法解决现实中的一些回归分析难题,是最近几年回归分析领域中的一个热门方向。本文以台风最大风速的预测问题为应用背景,针对该应用背景的输入变量多、样本间相关性、数据异常三大问题,采用贝叶斯框架下的三种方法:高斯过程回归模型、稀疏贝叶斯回归模型、概率主成分分析进行建模。本文主要做了以下四个方面的研究:(1)在使用高斯过程回归模型建模之前,针对输入变量较多以及输入变量与输出变量之间的非线性变化特点,计算各个输入变量和输出变量间的互信息,这些互信息间接地反映了各个输入变量和输出变量间的相关性。根据t检验法确定一个阈值,对于互信息小于阈值的输入变量作不相关变量处理,筛选出最佳的模型输入变量。然后采用高斯过程回归模型对筛选后的样本集进行拟合,在贝叶斯非参数建模的框架下,确定高斯过程回归模型的协方差函数。仿真结果表明,所得高斯过程模型能够满足绝对误差的预定要求,且具有很大的实用价值。(2)在使用稀疏贝叶斯回归模型建模之前,针对不同地区数据样本集间差异性很大等问题,引进混合模型的概念。考虑模糊C-均值聚类算法在初始聚类中心选择方面面临的弊端,提出了采用模拟退火遗传算法对初始聚类中心加以优化,以便提高聚类的准确性,最后采用稀疏贝叶斯回归模型对各子类样本分别建立稀疏高效的子模型。仿真结果验证了该混合模型的有效性。(3)针对前面工作中在聚类个数确定方面的主观性太强的缺陷,这一部分采用仿射传播聚类算法快速客观地对训练样本进行聚类。仿射传播聚类算法既不需要人为设定聚类数目,也不需要随机初始化聚类中心,能够充分考虑数据样本间的相似度,合理地对数据样本进行聚类,并将其划分为多个子类。子模型仍然采用稀疏贝叶斯模型建立,稀疏贝叶斯优越的稀疏性,降低了模型的复杂度。仿真结果表明,该混合模型比基于改进模糊C-均值聚类的混合模型有更好的预测效果。(4)在输入变量较多的情况下,由于人为原因或者仪器原因,容易发生遗失数据的情况,采用基于概率主成分分析的遗失数据重构方法,将异常数据和待预测变量均看作遗失数据处理。仿真结果表明,该方法的预测误差也能满足台风最大风速预测的绝对误差的预定要求,而且该方法比回归分析方法更为灵活。
其他文献
以重庆市、北京市、天津市、上海市四大直辖市2001-2011年的大气主要污染物的排放量为基础数据,建立API空气污染指数模型,计算出各污染物的分指数,并利用模型中的分指数,通过
现浇衬砌技术具有较好的防渗效果,并且施工工艺简单、美观和耐用,被广泛的应用于节水灌溉和调水引水工程。我国的南水北调工程主要采用的即是现浇衬砌防渗技术,更加说明了现
以建立弯曲应力为零、薄膜应力最小的曲面为目标,提出了一种基于计算机辅助几何设计(CAGD)的一体化有限元建模技术与造型优化方法。该方法通过参数联动、模型自动更新等功能,
本文通过广东国际大厦63层主塔楼的设计,对筒中筒结构在风力和地震、竖向荷载、竖向构件轴向变形、温度变化和楼板预应力张拉等影响下的位移和内力作了分析。还与用有机玻璃
建立了股票指数的随机微分方程模型,采用非参数估计方法对其进行估计,并给出了相应的非参数估计表达式,接着给出了具体的非参数估计算法,最后利用上证指数的收盘价数据进行实证分
<正> 绝大多数的女性都要经历分娩的过程。婴儿虽然降生了,但产妇机体还要经过一段时间才能复原。从分娩到产后42天是各器官系统恢复的时期,称为产褥期,俗称"月子"。月子做得
期刊
"产教结合、校企一体"的办学模式,是当前教育发展的新思路,高职院校会计专业依托校内实训基地——记账公司,对外开展代理记账服务业务,在创新教育模式基础上,让学生在真实会
目前征地的范围几乎涵盖了一切社会经济领域.但在征地过程中,由于在补偿方案和解除被征地集体单位人员安排等方面的后顾之忧问题上的配套法规及政策不到位,致使征地难的问题