论文部分内容阅读
随着3G时代的到来,移动网络的迅速发展,移动信息服务能为用户实时提供各种咨询服务,如天气、新闻、交通、股票、娱乐等等。移动信息服务正成为移动增值服务市场上的新热点。移动信息服务如果只提供通用型业务,将不能满足用户对信息的个性化需求。面向用户需求的个性化移动信息服务系统能帮助移动用户快速地从海量的信息中高效地获取有用知识、最新信息,以满足各种用户不同的个性化需求。向移动用户提供高质量的个性化移动信息服务,关键在于事先知道用户的兴趣,并准确地建立用户兴趣模型。本文对构建移动个性化信息服务系统的基础、核心技术——用户兴趣建模技术进行了研究。在分析了国内外用户兴趣建模技术的研究现状之后,提出一种新的用户兴趣挖掘系统UIMining,其功能是通过爬取用户已下载浏览的WAP页面,挖掘用户兴趣源,建立用户长期、短期兴趣模型,为构建高质量的个性化移动信息服务系统打好基础。本文首先叙述本课题研究的意义,介绍了目前国内外个性化服务及其核心技术用户兴趣建模的发展现状。基于3G移动网络,对用户兴趣建模技术中的主要技术数据挖掘进行了理论分析;接着本文提出一种用户兴趣属性挖掘系统UIMining,介绍UIMining的子模块功能。围绕UIMining的子模块,详细介绍了自动用户兴趣建模过程,包括用户兴趣挖掘和自动用户兴趣建模。在用户兴趣挖掘中,首先介绍爬取用户浏览页面提取文本信息的过程。在文本分词环节上,选择采用中国科学院研发的汉语语法分析系统ICTCLAS;其次详细介绍主题词提取子模块的方法和过程;最后采用改进的χ2统计量和词频统计关键词提取,为特征向量降维,采用决策树实现页面分类。在自动构建用户兴趣模型中,通过介绍用户兴趣表示方法和用户兴趣建模技术,提出一种新的基于用户访问频率的用户兴趣建模方法。详细介绍利用该方法构建用户长期兴趣、短期兴趣模型,更新用户兴趣模型。最后通过实验表明,UIMining系统能有效、准确的描述用户长期兴趣以及短期兴趣需求,在移动个性化信息服务中具有实际应用价值。