基于频繁模式挖掘算法的业务量预测研究

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:qq774257837
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
预测是大数据分析的主要目的之一,在许多领域都有很大的影响。在基站资源调度的实现中,往往并不需要准确地预测实际流量,而是需要准确地预测流量状态。这对于基站的睡眠策略,带宽,功率和资源块的控制都是非常重要的。在国内外基于无线蜂窝网络的流量状态预测研究方面,没有相关的算法可以合理解决业务量状态预测问题。因为在短时间内,业务量状态的转变往往较小,所以在大多数情况下,下一时刻的业务量与当前时刻之间没有太大波动。这意味着当将流量量化到有限数量的状态时,相邻时刻的业务量状态将处于相同的状态。那么如果用频繁模式挖掘最大支持度的原则预测,会导致未来状态的预测与当前状态相同,造成连续覆盖状态的现象,不能实现准确预测。因此当将频繁模式挖掘应用于预测时,使用最大支持原则来找到匹配模式不适用于时间序列预测。为了解决这些问题,在本论文中,提出了一种频繁模式挖掘方法,称为频繁模式挖掘匹配算法(Frequent Pattern Mining-Matching,简称 FPM-Matching),用于时空模型的业务量频繁模式挖掘与预测。论文的主要工作和创新点在于:1.针对无线蜂窝网络数据的频繁模式挖掘为了探究无线蜂窝网络数据的关联规则,挖掘蜂窝网络数据的频繁模式,本文考虑了不同类型的业务量数据,对中国南京和香港两个城市的无线蜂窝网络数据进行了广泛的实验,对基站业务量进行相关的统计分析以及互相关属性和自相关属性分析之后,提出了一种高效的频繁模式挖掘算法——FPM-Matching算法。根据业务量数据的相关性建立关联规则,利用支持度和置信度原则筛选出的满足阈值条件的序列称为频繁序列,通过使用树形结构存储频繁序列,让具有关联性的频繁序列会按照分层和节点渐进的方式构建频繁模式树。在这种情况下,每个频繁序列将在频繁模式树中具有唯一的位置坐标。2.基于频繁模式挖掘的业务量预测研究将十五天的基站业务量数据,整理成二维矩阵,矩阵的行数代表基站总数,矩阵的列数代表总时刻数。在预测过程中,提出了一种矩阵最大化来实现频繁模式匹配模式的方法,其中矩阵最大化是指将当前时刻作为匹配矩阵的最后一列,不断向左向下扩展矩阵,直到所匹配的矩阵满足以下两个条件:一、矩阵属于频繁模式树;二、该矩阵的所有扩展矩阵都不属于频繁模式树。利用FPM-Matching算法从无线蜂窝网络数据中挖掘并构建的频繁模式树,可以快速确定预测模式的位置,获得匹配候选集。评估结果表明,本文提出的FPM-Matching算法可以有效地利用训练集,获得稳定的模型参数,优化的匹配模式方法实现了对业务量状态的准确预测,具有预测准确率高和有效性强的优点。无论从时间复杂度还是准确率来说,FPM-Matching算法都具有明显的优势,可以做到合理降低算法运行时间和算法的输入量。3.基于时空模型的三维频繁模式挖掘以及业务量预测研究在资源调度的实现中,需要对某些区域进行流量数据的分析以及预测。通过对基站业务量数据进行空间划分网格的聚合处理分析发现,聚合后的流量数据的互相关性要明显高于未聚合的数据。为了探究基于无线蜂窝网络中,FPM-Matching的时空流量建模的有效性,本文从流量,地理空间位置,时序三个方面,将具有经纬度信息的基站业务量数据进行网格化,使基站流量空间聚合成网格流量,其中XY轴对应网格的空间位置,Z轴对应时刻,将基站业务量的时间序列整理成三维矩阵。通过FPM-Matching算法实现对三维矩阵中频繁模式的构建,并利用已构建的三维频繁模式实现对时空流量数据的准确预测。
其他文献
随着基础教育不断改革发展,越来越多的一线教师逐步意识到教学并不是仅仅是向学生传授课本知识,而是教会学生如何学习,以促进他们能力的养成。在新修订的《普通高中生物学课程标准》(2017年版2020年修改)中明确提出学校和教师应注重网络媒体资源、信息技术资源、生活资源以及其他社会资源的综合开发和利用,倡导并鼓励学生在解决实际生活问题的过程中深入理解和掌握生物学知识,即教师在教学设计中应关注学生生活经验,
为探索水稻光温敏核不育系在育性敏感期温度对异交特性的影响。以培矮64S、Y58S、广占63-2S、H638S为材料,在育性敏感期利用人工气候室设计24℃、27℃、30℃、33℃、36℃五个
地球上因为有水资源生命才能够生生不息,淡水更是人类生产生活方方面面都必不可少的重要资源。随着世界人口的过渡增长,工业和经济方面的快速发展,淡水资源的短缺问题日趋显著,人们寻求利用海水淡化技术获得淡水的想法愈发强烈,有越来越多的学者们投入到海水淡化的研究当中。然而,传统海水淡化需要消耗大量的能量,如果这些能量一味地由化石能源提供,那对化石能源的现有量来说无疑是雪上加霜。作为一种清洁且取之不尽用之不竭
研究目的来源于胰腺导管上皮细胞的恶性肿瘤占胰腺恶性肿瘤的绝大多数,简称胰腺癌(PC)。各种研究表明PC与胰岛素(INS)关系密切。而INS在由胰岛中的β细胞分泌后,可自由弥散到胰腺的细胞外液中,所以胰腺内存在一个高水平的INS环境。也正因如此,相比其他组织器官中的癌细胞,PC更有被INS影响的条件,研究PC与INS相关的分子机制具有十分深远的意义。目前已知INS有两个同源受体:胰岛素受体(IR)和
资源、人口和环境的和谐发展是当前世界各国人民面临的三大问题,尤其是环境和资源问题.近年来,随着全球经济和科技的高速发展,人类在过度消耗自然资源的同时也产生了越来越多
随着无线网络技术的不断演进,智能终端的快速普及,以及数据业务和多媒体业务使用量的爆炸式增长,通信网络和社会网络的联系越来越紧密,引起了许多研究者的注意,为其打开了一
在无线传感器网络(Wireless Sensor Network,WSN)中,传感器节点是由一次性的电池供电,并且传感器由于计算能力低、能量有限的特点无法独自完成较复杂的应用。因此,网关需要将
本文系统研究了不同种类木本泥炭肥料以及不同配比腐殖酸钾肥料的施用对烤烟生长、物理性质、烟叶化学等方面的影响,主要结论如下:1.不同种类木本泥炭肥料的施用可以不同程度
激光以其高亮度、单色性好、相干性好的显著特性,在精密计量、引力波探测和信息科学等领域有着广泛的应用。如果利用激光实现光学原子钟,便可使时间和长度标准达到更高精度,
本文是一篇针对于科技英语翻译的实践报告,翻译材料来源于“东盟国家科技组织发展问题研究”课题组任务。本次实践产生的译文便于委托人查阅东盟科技组织的信息,加深对于东盟科技组织的了解,进而改善目前较为有限的交流与合作现状。文章重点论述汉斯·弗米尔(Hans-Josef Vermeer)提出的翻译目的论对于本次翻译实践的理论指导。翻译目的论反对原文与译文在形式上的绝对对等,有利于译者关注翻译目的、译入语语