基于Hadoop的IPTV故障预判算法的研究及系统实现

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:ruqianwusan3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的不断进步和互联网技术的不断发展,IPTV正逐渐改变着人们的生活方式。然而由于IPTV机顶盒本身出现的故障或者网络传输堵塞等问题导致用户在使用IPTV机顶盒的时候偶尔出现卡顿、花屏等情况,造成了用户的体验下降。为了提升用户体验,减少用户的流失,运营商希望利用现有的IPTV机顶盒数据和报障用户数据建立IPTV故障预判模型,用以预测IPTV故障情况,以便在用户主动报障之前提前检测和维修IPTV机顶盒,解决用户即将面临的问题,提高用户体验。本论文就是基于这个问题展开研究的。一方面,本论文根据传统朴素贝叶斯分类算法的条件独立性假设条件,并结合数据属性本身的信息增益和数据条件属性与决策属性间的相关系数,将信息增益占整体信息增益的比值和属性间的相关系数作为综合权重,提出了一种基于综合加权的朴素贝叶斯分类算法,作为IPTV用户报障预测中的分类器。实验结果表明,该算法比普通NB算法、WNB-G算法、WNBCC算法的分类效果要好且性能更加稳定。另一方面,由于IPTV数据集是一个非均衡的数据集,本论文结合IPTV数据的特点,对传统非均衡数据集处理算法SMOTE做出了改进,提出了一种改进型SMOTE过采样算法,实现非均衡数据的处理。该算法首先通过K-Means方法对少数类样本进行聚类,然后在每一个类簇中利用样本的近邻类型之间的数量关系再次对类簇进行分类,并删除噪声样本。然后根据输入的随机数与类簇中子类样本数量的比例关系选择在不同的子类样本中进行SMOTE再抽样。最后我们将该算法跟综合加权的朴素贝叶斯分类算法结合起来建立IPTV用户报障预测模型。实验结果表面,该模型比其它模型预测效果要好。在系统实现方面,本论使用Hadoop平台建立IPTV故障预判系统,并实现了一个易于操作的前端可视化界面。后台主要包括数据存储、分布式计算、通信几个功能,前端可视化界面主要提供登录功能、权限管理、交互功能、显示功能、管理功能。
其他文献
采用文献资料法、实验测量法、数理统计法等对兴义民族师范学院大学生体质健康状况进行分析,找出大学生体质健康存在的问题,并提出合理建议,以期提高大学生体质健康水平。
目的:探究神经介入治疗中常见的并发症以及处理对策,以期提高临床治疗的效果。方法:将2014年7月~2016年7月某院收治的需行神经介入治疗患者96例作为研究对象,对其临床资料展开
我国的书法艺术从古至今历经千年传承,是地地道道的中华传统文化之一。书法既有着丰富的内涵,也是中国精神的代表之一。文章对书法与现代设计的创新性融合进行探究,对当今时
近些年食品中重金属超标引发很多问题,严重危害人民群众的生命健康和社会稳定。传统重金属检测方法有原子吸收光谱法,原子荧光光谱法和X射线荧光光谱法等,其具有检测灵敏度高
<正>有些人说深圳是一片文化沙漠,没有文化,更没有音乐,小编觉得这是对深圳的一种误解。深圳作为全国最前沿的城市之一,有着得天独厚的社会环境和人文环境。"原作音乐主题餐
<正> 我们常常看到眼镜行有些验光员给顾客配花镜时,在不了解屈光状态及度数的情况下,只根据年龄,甚至不管年龄随便试戴现成的左右度数相同的花镜。这样不仅花费时间较多,更
期刊
对秦皇岛、唐山和沧州农村社会管理模式创新的现状进行调研,发现存在的问题,探寻出构建农村新型社区管理模式的有效途径如下:加大政府支持力度,科学规划,强化农村基层组织;充
本研究采用部分肾切除(5/6切除)的方法建立了SD大鼠慢性肾衰模型,并通过检测相关病理和生化指标对其进行了鉴定。免疫组化和RT-PCR结果显示5只慢性肾衰大鼠的肝、脾、肾组织中HO-
目前,电网规模随着国民经济的迅速发展而日渐扩大,更需要合理的电网规划保证电力系统稳定运行。电网规划对日后电网的发展建设有着至关重要的作用,合理的电网结构是保证电网
残雪以一种独特的形式给人们勾画了一个“丑”的、感觉的、荒诞的小说世界 ,而指引她的思想流动的是其与众不同的创作个性与心理。它和残雪的生活经历、教育背景等密切相关 ,