论文部分内容阅读
在智能手机快速普及的今天,越来越多的移动手机APP出现在人们的生活当中。这些APP可以利用手机上各种形式的传感器收集到大量有价值的端侧数据。同时,针对APP的线上数据与功能建模也可以分析使用者的需求与爱好。如何能够更高效的利用这些数据辅助商业决策与广告成为了当前热门的研究领域。而用户画像从诞生开始就一直是分析用户特征的利器。用户画像算法通过挖掘用户的特征与行为信息获取用户的私人属性与标签,能够在下游任务中更加直接的描述用户特征。因此,如何使用各种APP数据与用户对APP的使用行为构建用户画像是非常有应用前景的研究领域。为了解决这个问题,学术界和工业界都提出了一系列方法对移动APP的用户画像建模,但由于移动用户的数据产生源比较分散,并且形式多样,加之隐私保护问题,因此目前的研究仍然面临许多挑战。首先,当前用户的隐私意识越来越强,研究者难以使用问卷调查等方法直接获取用户画像。本文提出了一种利用用户对APP的下载与评论数据进行建模、分析用户的算法。如上所述,用户对APP的使用数据可以反应用户的兴趣爱好。但是用户对自己手机的操作是用户的个人隐私。在无法获得用户的手机使用记录情况下,用户对APP的下载与评论行为同样可以反映出用户对APP使用情况。本文基于这两种行为设计出不同的预训练任务,结合APP的功能使用预训练模型对用户画像建模。由于用户评论与APP信息中包含大量的文本特征,本文使用了当前NLP领域最为热门的BERT模型对这些特征进行预处理。本文将用户画像应用到下游推荐任务当中,证明该画像可以有效地表征用户。接着,本文针对目前移动设备计算资源仍然不充足的问题,提出了一种挖掘用户位置数据与屏幕状态变化数据中周期性的用户画像算法。该算法可以用于计算用户的住宅、工作地的位置和用户的日程表。本文首先在移动终端设备上使用采集数据计算短期用户画像,然后在云服务器上使用短期用户画像计算最终的长期用户画像。这种将算法在逻辑与架构上分成两部分的设计在保证计算效果的前提下减少算法需要使用的计算资源与存储资源,一定程度上规避了隐私风险。最后,本文基于用户画像算法实现了一个APP商城系统。用户可以使用APP商城浏览、管理与下载应用。系统可以计算用户画像并且应用到内置的推荐系统当中,从而实现APP的个性化推荐。