论文部分内容阅读
目前,随着大数据的广泛普及以及数据分析挖掘技术的提高,人们对从大量的、类型繁多的、价值密度相对较低和时效性要求高的大数据中提取出有用信息的方法越来越关注,要求也越来越高,而运用推理模型对现实中的大数据进行建模、优化,可以有效地挖掘出其中内在规律或预测其发展变化。由此,各类推理模型的研究也一直是数据挖掘研究的重点,然而,过适应问题始终是影响推理模型发展的一个重要因素。本文主要是对从给定的推理模型中挑选出最优推理模型的研究。其中,最优推理模型指的是解决了过适应问题的模型。本文将最小描述长度的概念引入到推理模型中,基于对一系列备选模型描述长度的最小值确定最优模型,以有效避免过适应现象并保证预测准确性。文中给出利用最小描述长度方法确定最优神经网络模型中神经元个数的具体推导过程,以及算法收敛性等性质。进而利用基于最小描述长度的神经网络模型的方法来对现实中浮动车交通状况进行短期的推理预测以及路况推演,实现成功应用。本文研究了最小描述长度的理论,给出了一般参数模型中最小描述长度的推导过程。对于神经网络的推理模型,由于过适应问题带来的过早结束训练过程产生的误差,本文研究了基于最小描述长度的神经网络推理模型,具体研究当神经元的个数改变带来的描述长度的改变,并从中选取使得描述长度最小的神经元,也就是最优的神经网络推理模型。同时,文中还研究了神经网络中最小描述长度的性质,以及在实际应用中的拟合函数。随后,本文利用改进的神经网络推理模型对基于浮动车数据的交通状况进行了短期的推理。主要是基于历史的浮动车数据,对下一时刻的路况进行了预测分析,并结合之前得到的结论验证其准确性,并分析了不同条件下最优神经网络模型的选择。而针对现有浮动车速度模型存在的一些问题,本文还基于实时的浮动车数据建立了一个改进的速度模型,用来实现对交通状况实时检测的效果。