论文部分内容阅读
预测是大数据分析的主要目的之一,在许多领域都有很大的影响。在基站资源调度的实现中,往往并不需要准确地预测实际流量,而是需要准确地预测流量状态。这对于基站的睡眠策略,带宽,功率和资源块的控制都是非常重要的。在国内外基于无线蜂窝网络的流量状态预测研究方面,没有相关的算法可以合理解决业务量状态预测问题。因为在短时间内,业务量状态的转变往往较小,所以在大多数情况下,下一时刻的业务量与当前时刻之间没有太大波动。这意味着当将流量量化到有限数量的状态时,相邻时刻的业务量状态将处于相同的状态。那么如果用频繁模式挖掘最大支持度的原则预测,会导致未来状态的预测与当前状态相同,造成连续覆盖状态的现象,不能实现准确预测。因此当将频繁模式挖掘应用于预测时,使用最大支持原则来找到匹配模式不适用于时间序列预测。为了解决这些问题,在本论文中,提出了一种频繁模式挖掘方法,称为频繁模式挖掘匹配算法(Frequent Pattern Mining-Matching,简称 FPM-Matching),用于时空模型的业务量频繁模式挖掘与预测。论文的主要工作和创新点在于:1.针对无线蜂窝网络数据的频繁模式挖掘为了探究无线蜂窝网络数据的关联规则,挖掘蜂窝网络数据的频繁模式,本文考虑了不同类型的业务量数据,对中国南京和香港两个城市的无线蜂窝网络数据进行了广泛的实验,对基站业务量进行相关的统计分析以及互相关属性和自相关属性分析之后,提出了一种高效的频繁模式挖掘算法——FPM-Matching算法。根据业务量数据的相关性建立关联规则,利用支持度和置信度原则筛选出的满足阈值条件的序列称为频繁序列,通过使用树形结构存储频繁序列,让具有关联性的频繁序列会按照分层和节点渐进的方式构建频繁模式树。在这种情况下,每个频繁序列将在频繁模式树中具有唯一的位置坐标。2.基于频繁模式挖掘的业务量预测研究将十五天的基站业务量数据,整理成二维矩阵,矩阵的行数代表基站总数,矩阵的列数代表总时刻数。在预测过程中,提出了一种矩阵最大化来实现频繁模式匹配模式的方法,其中矩阵最大化是指将当前时刻作为匹配矩阵的最后一列,不断向左向下扩展矩阵,直到所匹配的矩阵满足以下两个条件:一、矩阵属于频繁模式树;二、该矩阵的所有扩展矩阵都不属于频繁模式树。利用FPM-Matching算法从无线蜂窝网络数据中挖掘并构建的频繁模式树,可以快速确定预测模式的位置,获得匹配候选集。评估结果表明,本文提出的FPM-Matching算法可以有效地利用训练集,获得稳定的模型参数,优化的匹配模式方法实现了对业务量状态的准确预测,具有预测准确率高和有效性强的优点。无论从时间复杂度还是准确率来说,FPM-Matching算法都具有明显的优势,可以做到合理降低算法运行时间和算法的输入量。3.基于时空模型的三维频繁模式挖掘以及业务量预测研究在资源调度的实现中,需要对某些区域进行流量数据的分析以及预测。通过对基站业务量数据进行空间划分网格的聚合处理分析发现,聚合后的流量数据的互相关性要明显高于未聚合的数据。为了探究基于无线蜂窝网络中,FPM-Matching的时空流量建模的有效性,本文从流量,地理空间位置,时序三个方面,将具有经纬度信息的基站业务量数据进行网格化,使基站流量空间聚合成网格流量,其中XY轴对应网格的空间位置,Z轴对应时刻,将基站业务量的时间序列整理成三维矩阵。通过FPM-Matching算法实现对三维矩阵中频繁模式的构建,并利用已构建的三维频繁模式实现对时空流量数据的准确预测。