论文部分内容阅读
通过用户数据挖掘用户属性特征是近年来学术界和工业界的研究热点,用户画像技术更是其中的重要基础研究点。用户画像技术可以理解个体用户的需求,挖掘群体用户的特征,发现潜在的用户群体,以便更好地为用户提供定制化服务和个性化推荐。自我国进入移动通信时代以来,人们与手机之间的连接更加紧密,手机已成为人们日常生活中不可或缺的一部分。手机在使用中产生了记录用户的位置信息、使用信息、社交信息等历史数据。这些数据隐含了很多与用户的个性化信息,为研究用户属性特征和把握城市生活脉搏提供了新的信息渠道。本课题旨在通过对话单数据的分析,完成对移动通信用户的个体画像研究和群体画像研究,为推测用户属性、理解用户特征提供了新的视角,也为生产生活的提高、相关政策的制定提供了参考。当前对话单数据的研究多集中在时空信息方面,本文综合了话单数据中的时空信息、社交信息和活跃时间规律对用户进行画像研究。首先为了更方便的分析用户的时空数据,本文利用点间相对定位方法,将经纬度坐标转换为常用的二维平面直角坐标,使得通信小区之间的距离关系和方位关系得到保留并且位置计算更加方便。其次本文根据用户移动模式的移动强度、范围、活跃地点规律、出行方向的随机性提取了移动距离、回旋半径、访问点个数、移动方向熵特征:根据用户社会生活的活跃程度、规模、主动程度、集中程度提取了通话时长、联系人数量、主叫比率、社交熵特征;同时根据用户活跃时间规律提取了用户活跃时间特征。再次,为了使用户个体的特点被清晰呈现,本文对用户的多个特征采用不同的规则进行处理并生成用户标签,然后使用词云图将每个用户的标签生成词云名片。最后根据移动模式和社交生活将用户划分为四个用户群,探究各个用户群体的特点并分析用户群体在活跃时间方面的规律性,探索用户的移动模式、社会交往与用户活跃时间的联系,加深我们对用户特征的理解。