论文部分内容阅读
随着WEB2.0技术的不断发展和成熟,互联网已经变得越来越智能化人性化和社会化它开始逐渐渗透到人们生活的方方面面,影响并改变着人们的生活方式作为WEB2.0时代的代表性产品——社交网络已经以迅雷不及掩耳之势席卷了全球社交网络平台上用户的交互信息开始呈现出爆发式的增长趋势然而,人们却面临着信息爆炸但是智慧贫瘠的尴尬局面[1]互联网WEB2.0时代的核心概念便是以用户为中心,重视用户体验和用户交互因此,如何有效地收集和利用社交网络平台上海量的用户交互信息,并从中挖掘出有价值的知识,以此来提高社交网络的用户体验,成为了互联网行业研究和讨论的热点为了提高社交网络海量用户交互数据的使用率,本文尝试性地将WEB数据挖掘技术引入到社交网络的应用中去通过对WEB数据挖掘技术社交网络特性以及个人标签云的相关理论的深入研究和探索,创新性地提出了基于社交网络平台的个人标签云的概念,并设计和实现了社交网络个人标签云系统本文的主要工作包括以下两个方面:第一理论研究部分,首先详细的分析了数据挖掘和WEB数据挖掘的相关理论,总结了当前它们的主要技术分类数据源功能处理流程以及面临的关键问题等,为后文在实践中使用WEB数据挖掘打下了很好的技术理论基础其次细致地概括和研究了社交网络的相关特性,分析了社交网络的组成元素主要内容结构表达方式主要特点和功能等帮助我们全面地了解到了社交网络的发展状况体系结构用户需求模型以及面临的主要问题为后文开发基于社交网络的个人标签云提供了很好的平台理论基础第二实践研究部分,主要体现在设计和实现了基于社交网络的个人标签云系统首先深入地研究并设计了社交网络数据预处理的方法,主要分成日志预处理和文本内容预处理两部分来进行详细说明,为后文文本挖掘提供了高质量的数据源其次分步骤细致地介绍了个人标签云的设计与实现,并总结了创建基于社交网络的个人标签云的现实意义,为未来的研究工作指明了方向