移动互联网网络侧数据预处理技术的研究和应用

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ssttll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动互联网和大数据是近些年来学术界和工业界研究的热点问题,电信运营商在向移动互联网用户提供服务的同时,产生了海量的移动互联网网络侧数据。如何从这些海量数据中快速、准确、高效地提取价值,是电信运营商和学者们关注的核心问题。数据挖掘是从这些大数据提取价值的有效方法,数据挖掘的算法和模型已经得到了深入的研究和广泛的应用。数据预处理是数据挖掘中的重要步骤,它为数据挖掘模型提供干净、规范、适合的模型输入,并提升数据挖掘模型的性能和效率。然而,在实际数据挖掘应用中,数据的预处理工作通常在数据分析工作中占很大比重的工作量,特别对于时间序列这类复杂数据,预处理甚至会占到八成以上的工作量,研究和构建自动化的数据预处理系统是提高工作效率的必要途径。构建自动化的数据预处理系统的难点包括以下三个方面:如何自动选择预处理算法和参数、如何自动化进行预处理模型的重训练以及如何定量评价数据预处理的效果。其中自动化的预处理算法组合策略是实现自动化预处理系统的必要条件,因为实际数据预处理任务必须过过若干预处理组件同时完成。本文提出了一种基于启发式搜索的自动化算法组合策略。本文的研究内容主要分为三个方面,首先,研究和分析了多种数据预处理方法,并构建了针对移动互联网网络侧数据的数据预处理系统。其次,针对移动互联网网络侧数据这种时间序列数据,本文提出了一种数据预处理流程,能有效针对时间序列数据进行预处理工作。最后,本文提出了一种基于启发式搜索的自动化的数据预处理组合策略,能够在给定的数据处理组件集合中选择若干预处理组件及参数,并按照一定的顺序对原始数据进行自动化的预处理。
其他文献
移民问题作为全球化的重要产物之一日显其重要性,逐步得到各国政府和国际社会的关注。尽管关于移民问题的多边合作和对话始于20世纪90年代,但移民问题全球治理的程度仍然较低
传统的手部康复手套通常以电机作为驱动器,具有体积大,笨重和柔顺性差的缺点。近年来,柔性气动驱动器由于其内在的柔顺性、灵活和安全等优点,被认为相对于传统的电机驱动更适
目的:采用RP-HPLC法研究地黄中毛蕊花糖苷随炮制时间动态变化的情况,建立生地黄和熟地黄中毛蕊花糖苷及异毛蕊花糖苷的含量测定方法。方法:采用Agilent TC-C18色谱柱,柱温30
经济全球化促使中小企业走向国际市场,然而由于中小企业自身的特征使其跨国营销陷入困境。基于互联网新经济的出现,为中小企业进行国际营销提供了机遇。本文从新经济给中小企
随着生活水平和质量的日益改善,现代社会中人们对汽车舒适性的要求逐渐提高。汽车行驶时,引起各部件振动的原因主要来自路面不平度的随机激励和发动机工作时所产生的激励。为
目的:本研究对收入院老年痔病患者的临床资料进行采集,分析探讨该疾病的治疗过程中各个环节,讨论影响老年痔病患者手术的相关问题,以期归纳总结出老年痔病患者手术治疗中出现
目的:探求附子及其不同组分中乌头类生物碱的含量,研究附子不同组分对正常及低血压大鼠的血压调节作用,常规与超大剂量附子对正常大鼠、低血压大鼠血压的“量-时-效-毒”关系
<正> 《木兰诗》以北朝乐府民歌代表作品的身份称誉文坛由来已久。在漫长的流传过程中,历代读者对这首民歌,一面不厌地欣赏,一面深入地研究。然而,如何概括《木兰诗》的主题?
目的:观察消肿止痛膏及其巴布剂对急性踝关节扭伤的临床疗效。方法:将90例急性踝关节扭伤患者随机分为3组各30例,分别采用冰敷(冰敷组)、消肿止痛膏(消肿止痛膏组)及消肿止痛
目的:探讨高、低剂量瑞芬太尼联合丙泊酚对老年患者腹部手术后早期POCD的影响。方法:选取2014.10—2015.08普外科行开腹手术的老年患者90例作为研究对象,要求年龄65-80岁,ASA