WEB数据挖掘及其在社交网络的应用研究

来源 :电子科技大学 | 被引量 : 21次 | 上传用户:scholar165
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着WEB2.0技术的不断发展和成熟,互联网已经变得越来越智能化人性化和社会化它开始逐渐渗透到人们生活的方方面面,影响并改变着人们的生活方式作为WEB2.0时代的代表性产品——社交网络已经以迅雷不及掩耳之势席卷了全球社交网络平台上用户的交互信息开始呈现出爆发式的增长趋势然而,人们却面临着信息爆炸但是智慧贫瘠的尴尬局面[1]互联网WEB2.0时代的核心概念便是以用户为中心,重视用户体验和用户交互因此,如何有效地收集和利用社交网络平台上海量的用户交互信息,并从中挖掘出有价值的知识,以此来提高社交网络的用户体验,成为了互联网行业研究和讨论的热点为了提高社交网络海量用户交互数据的使用率,本文尝试性地将WEB数据挖掘技术引入到社交网络的应用中去通过对WEB数据挖掘技术社交网络特性以及个人标签云的相关理论的深入研究和探索,创新性地提出了基于社交网络平台的个人标签云的概念,并设计和实现了社交网络个人标签云系统本文的主要工作包括以下两个方面:第一理论研究部分,首先详细的分析了数据挖掘和WEB数据挖掘的相关理论,总结了当前它们的主要技术分类数据源功能处理流程以及面临的关键问题等,为后文在实践中使用WEB数据挖掘打下了很好的技术理论基础其次细致地概括和研究了社交网络的相关特性,分析了社交网络的组成元素主要内容结构表达方式主要特点和功能等帮助我们全面地了解到了社交网络的发展状况体系结构用户需求模型以及面临的主要问题为后文开发基于社交网络的个人标签云提供了很好的平台理论基础第二实践研究部分,主要体现在设计和实现了基于社交网络的个人标签云系统首先深入地研究并设计了社交网络数据预处理的方法,主要分成日志预处理和文本内容预处理两部分来进行详细说明,为后文文本挖掘提供了高质量的数据源其次分步骤细致地介绍了个人标签云的设计与实现,并总结了创建基于社交网络的个人标签云的现实意义,为未来的研究工作指明了方向
其他文献
从皮亚杰开创说谎研究以来,研究者们对谎言进行了多角度、跨领域的研究。对说谎的发展研究可以追溯到发展心理学的开端,近年来越来越多的发展心理学者开始关注说谎的发展,主
目前存在一种流行的看法:律师天然就是政治家,因此律师参与政治是一种天职。本文把这种看法视为一种未经严肃学术考证的"大胆假设",并试图在理论和经验两个层面上对此进行"小
文化产业在世界范围内被公认为朝阳产业和“黄金产业”。当今世界,文化产业已逐步发展成为各国经济的支柱产业和新的经济增长点。新闻出版业是文化产业的基础和核心组成部分,
通过对山东特有植物观赏特性的综合分析,筛选出5 种有开发利用价值的山东特有野生花卉,并对其分布、习性、园林用途和繁殖栽培技术作了初步研究 Through the comprehensive ana
目的:探讨解郁汤治疗女性迟发性痤疮的临床疗效,观察治疗前后患者生活质量的变化情况。方法:将72例临床患者随机分为2组,治疗组37例,内服解郁汤,每日两次,并给予适当心理疏导,外用异
纪检监察特派员管理信息系统是中国建设银行为贯彻“内控先行”、“风险控制优先”的经营和管理理念,和防范风险关口前移、遏制案件发生,强纪检监察队伍建设,提高纪检监察工
<正> 上海博物馆在文物出口鉴定工作中征得1件元景德镇窑青白釉釉里红人物瓶(图一)。瓶残高33、腹径17、足径11.5~12厘米。口沿残,后经修复。口微侈,颈部较长略收敛,椭圆形腹,
<正>改革开放后,我国经济高速增长,经济规模不断扩大。伴随着经济的高速增长,国内洗钱犯罪日益严重,洗钱手段和方法日益翻新。反洗钱是国家制定法律法规,规定特定机构对可能
产业关联是一种客观存在的重要的社会经济基础关系,是指产业分工体系中不同产业之间功能上相互支持和依存的经济技术关系。不仅产品与服务的生产与流通等环节发生的企业间交