微博会员流失预测

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:macrosoft
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展,中国已经进入到互联网时代,各个互联网公司、企业已经积累了TB级甚至PB级的用户数据,这些数据作为互联网公司的巨大财富,加以利用,可以给公司有效节约成本、增加收入。因此如何挖掘出隐藏在数据中的某种规律,显得十分重要。数据挖掘技术是是通过数学模型方法对数据进行拟合,利用计算机技术去实现模型,最后反馈到业务实施建议上的技术。在客户流失预测方面,有很多数据挖掘的分类算法可以有用武之地。本文针对国内社交平台新浪微博的会员数据,利用数据挖掘中的分类预测算法,对会员流失进行预测。基于2015年4月2日至8日会员身份即将到期的26171位微博会员用户的数据,首先利用k-means聚类,选用用户属性和主动行为数据作为特征,对用户进行细分,找出了价值较高的用户群体。对于本文的不平衡样本集,对样本量较少的类别采用有放回重复抽样的方法。然后选用70%的样本作为训练集,利用逻辑回归、决策树C5.0、神经网络分类预测模型,对会员是否流失做出预测,其中逻辑回归在ROC曲线和提升图上均表现地比决策树C5.0要好。之后引入代价敏感学习,对于将流失用户预测为非流失会员用户加大了代价,改进决策树C5.0,预测出了流失用户名单,用于企业挽留措施的目标群体。
其他文献
将应急管理工作纳入国家治理体系和治理能力现代化的大盘子,通过健全制度体系、创新体制机制等措施和方法,予以统筹考虑和科学推进。$$我们既要有解决安全发展问题的历史紧迫感
报纸
消防监督工作是国家赋予公安机关的重要职责,是预防火灾、减少火灾损失和保护国家财产、公民人身、公民财产安全的重要措施。公安派出所是公安机关的基层单位,公安派出所开展
随着全球政治生态的变迁,信息能力日益成为政府竞争力的关键.以公众为中心的电子政务不仅为提升政府信息能力奠定了基础,而且为强化政府的公共决策能力、政策执行能力与政策
<正> 罗马尼亚通讯社记者去拜访于1956年、1957年两度访问中国的罗马尼亚画家格&#183;萨波&#183;贝拉时,问道:“你从中国回来以后,做些什么工作?”这位国家奖金获得者、罗马
我国体育产业的兴起,源自我国体育社会化的改革,体育舞蹈的推广和传播具有强烈的社会性,完全是一种“由下而上”的发展顺序,但在体育产业化过程中,体育舞蹈凸显出的发展方式
夜战夜训曾经是我军的优势和强项,但受指导理念、制度机制、组训模式、保障条件等因素的制约,部队的夜间训练整体呈现弱化趋势,与强敌的差距拉大。如何在全军大抓实战化训练的背
报纸
本文通过系统考察统计学的整个历史发展历程,论述了教育统计学的产生与发展、学科性质、研究对象、主要内容及其与相关学科的关系等几个主要问题,从而说明了教育统计学对统计
作为美国陆军最重要的一级司令部之一,训练与条令司令部总部位于弗吉尼亚州的尤斯蒂斯堡,共有各类军职、文职人员3.8万人,下辖陆军学员司令部、初始军事训练司令部、征兵司令部
报纸
目前房地产开发企业偷逃税的原因有法定税负高、偷税所带来的收益较大、税负不平衡、税收征管不到位等。应采取从政策上解决房地产企业法定税负高、税负不平衡的现象;清理税收