基于用户大数据的特征分析及可视化

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:yhymoon0527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从用户这个名词诞生的一刻开始到现在,围绕用户特征的研究一直是重要的课题。在工业界中,用户的具体特征分析能够对策略定制或是产品改善有着重要的指导作用。在学术界里,用户的各项数据更是各领域研究学者为了研究人类或是社会的重要材料。本文主要研究了用户通信数据,并围绕用户的轨迹特征展开。透过轨迹特征能够研究城市中拥有不同活跃度类型的人群,并利用其活跃度特征进行常驻位置挖掘。另一方面,一般利用通信数据的研究都会将每条通信记录所对应的基站位置作为用户的近似所在位置,但是通过这种方式提取出的近似轨迹往往与真实轨迹有着较大的偏差,所以同时需要一些纠偏的方法。最后,为了让轨迹的研究成果能够被更好的展现并被人们理解,可以使用各式各样的可视化方法。本文的主要工作如下:首先,利用流量详单数据中的地理信息,提取了用户的活跃度特征并进行了聚类,并对聚类结果进行了分析以了解城市中不同活跃度类别的人群。接下来提出了一套算法框架以进一步利用他们的特征寻找对应用户的常驻位置。其次,本文提出了一套基于流量详单URL数据对近似轨迹进行纠偏的算法。从数据中获取到的轨迹由于直接使用基站位置近似地作为用户位置,所以由此产生的用户近似轨迹存在有一定的误差。但利用流量详单URL字段中偶尔出现的GPS精确定位信息,对近似轨迹的纠偏就成为了可能。本文将这些GPS定位信息作为纠偏位置建立了目标函数,并进行优化目标求解以对原近似轨迹进行纠偏。最后,本文搭建了一套轨迹的可视化与分析系统。数据的可视化一直是数据科学中非常重要的领域,尤其对于轨迹数据这种有着详细的现实意义但又非常抽象的数据形式有着非常好的效果。本文基于MATLAB建立的轨迹可视化与分析系统能够根据所提供的数据播放轨迹动画并包含例如POI分析,常驻区域查找、轨迹分段等功能,为轨迹的研究起到非常好的辅助作用。本文的研究结果将对基于用户大数据,尤其是用户轨迹的特征分析做出一定贡献。不同的活跃度特征人群能够为城市规划、公司用户画像研究提供支持。近似轨迹纠偏能够在精确数据量稀缺的情况下尽可能对轨迹进行修正。而可视化系统能够更好地服务于非技术人员,或是为研究人员提供辅助功能。
其他文献
这是我们安徽省唯一一处被江泽民同志亲自命名的历史文化景观,这是我们安徽省唯一一处被称为“世界第九大奇观”的神秘之地。它,就是奇窟成群的花山谜窟。花山谜窟地处安徽省
随着网络技术的飞速发展,骨干网运营和安全的需求,骨干网流量检测系统已经成为网络设备生产商的主营产品。在传统的骨干网流量检测系统中,DNS解析一般是利用离线捕包分析,再
今年初,习近平总书记在中共中央政治局第十二次集体学习时强调,要运用信息革命成果,推动媒体融合向纵深发展,做大做强主流舆论,巩固全党全国人民团结奋斗的共同思想基础。当
压接型绝缘栅双极型晶体管(IGBT)内部存在多层接触界面,为研究界面间接触热阻对器件整体热特性的影响,建立了考虑接触热阻的压接型IGBT热仿真模型。通过建立压接型IGBT器件结
文章对重庆寸滩港集装箱码头的概况及其现行的集装箱装卸工艺流程进行了简要分析,对具体装卸工艺环节提出优化方案并进行数学建模,最后运用Arena软件来进行相关模型的仿真验证,
文章以北海航海保障中心天津航标处值班室为例,以职能定位为出发点,梳理了满足航标运行监管职能的装备现代化需求,介绍了天津航标处值班室装备现代化建设思路。
文章针对IMO新规则下进入封闭处所的要求和建议,对航海专业学生进入封闭处所实践教学课程进行规划和设计。通过较系统的培训和教学,以期提高船员风险意识,降低船员安全风险。
针对2014年全国大学生数学建模竞赛A题'嫦娥三号软着陆轨道设计与控制策略'问题,根据全国评阅的具体情况,首先介绍了问题的要求和评阅基本要点;然后给出几种有代表性