【摘 要】
:
随着大数据时代的到来,全球每天产生的数据量有着惊人的量级,庞大的数据犹如冰山一样,我们通过数据表面获取的信息只是冰山一角而已。于此同时,机器学习、数据挖掘技术也在突飞猛进的发展,利用这些技术我们可以挖掘出大量数据之间的关系,挖掘出数据背后的巨大价值。有了数据和处理技术,我们便可以将它们进行融合,并应用到商业场景中,让公司更懂他们的用户,为用户带来更优质的服务。本项目便是这样的一个平台,挖掘出用户的
论文部分内容阅读
随着大数据时代的到来,全球每天产生的数据量有着惊人的量级,庞大的数据犹如冰山一样,我们通过数据表面获取的信息只是冰山一角而已。于此同时,机器学习、数据挖掘技术也在突飞猛进的发展,利用这些技术我们可以挖掘出大量数据之间的关系,挖掘出数据背后的巨大价值。有了数据和处理技术,我们便可以将它们进行融合,并应用到商业场景中,让公司更懂他们的用户,为用户带来更优质的服务。本项目便是这样的一个平台,挖掘出用户的标签,为每一位用户创造一个合适的画像,继而提供个性化的营销方案。本文通过对比国内外的大数据平台、用户画像、精准营销的发展现状,选择了一套适合本平台的大数据服务架构、用户画像挖掘策略、机器学习算法和营销方案,并详细介绍了它们的相关理论和技术方案。随后,对整个平台进行需求分析,将平台拆解出不同的模块,本文选取了其中几个重要模块:数据提取模块、人群标签模块、设置活动信息模块、宣传投放模块、业务看板模块进行详细的介绍,并对平台的非功能性需求进行了阐述。其次,介绍了平台的功能结构、架构设计以及大数据存储设计。大数据架构采用的是Spark分布式计算引擎,可以对数据进行离线处理和实时处理。然后,本文介绍了人群标签的挖掘流程,以短信CTR转化率为例,选取GBDT+LR的模型算法,其准确率可达84%。最后,对本项目进行了总结,同时也对其未来发展做出了一定程度的展望。本项目已经接入了5条业务线,服务于数千人的运营人员、分析师,将个性化营销活动推送到了数千万人手中。
其他文献
<正>润滑系统是发动机重要系统,其正常的机油压力是保证发动机各摩擦件之间得以充分润滑的前提和必要条件。柴油机在额定转速1500 r/min,机油压力应不低于0.35 MPa。车辆行驶
桐城派纪游散文体物达意不乏情趣,章法严谨不伤性灵。“三祖”之一的姚鼐更是在简短的景物描写中创造出晶莹澄澈、透润无瑕的艺术境界,展示了其“道与艺合,天与人一”的文学主张
现代政治文明的广泛推进、全球经济的高速增长和通讯技术的迅猛发展,使得大众传媒日益发达,在社会的变革发展中扮演着越来越重要的角色。人们已生活在一个媒体无处不在的社会
我国高中英语教学中"中国文化失语"的问题越来越突出,教师在教学中过分重视了西方文化,强调语法和西方文化之间的内在联系,忽视了中国本土文化知识的融入和渗透。因此,高中英
目的:研究颅内肿瘤放射治疗定位体表标记点位置选择对后续放射治疗摆位误差的影响。方法:颅内肿瘤患者59例,定位体表标记点选眉间为正中参考点,两侧为翼点,分析体表标记点中
<正>发动机涡轮增压器在使用2000~2500 h后,即使还能正常运转,也应该对其转子的轴向移动量做不解体测量。为此,应将进、排气管从增压器上拆下,用千分表触头顶在转子轴上,然后
目的:1.探讨多层螺旋CT及重建技术在肠梗阻的诊断及其临床上的应用价值。2.探讨各CT检查和重建技术对不同类型肠梗阻的作用。3.建立不同类型肠梗阻的特异性影像学征象,提高严
目的:分析永久性心脏起搏器植入后感然的可能原因和处理方法。方法:回顾性分析2002年1月~2007年12月因“起搏器植入术后感染”在本院治疗的病人病例资料,分析感染出现时间、发
本文在阅读了大量中英文关于自我妨碍问题研究文献的基础上,对自我妨碍的概念、研究方法和理论,以及对当前国内外关于自我妨碍问题研究的现状进行了综述,并针对有争论的问题
<正>铝及其化合物具有两性,运用两性来鉴别物质或与其他物质分离是高考考查的重点.本文在科学取向教学论指导下,聚焦Al3+、Al(OH)3、AlO-2之间的转换,并深入分析原理,利用Al(OH)3