基于Web的用户行为分析和挖掘的关键技术研究

被引量 : 14次 | 上传用户:dykonka
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络用户行为分析是一种新的、迅速发展的领域,它已成为当今研究的热门话题,如何为用户提供高品质和个性化的服务,如何满足用户的需求是急需解决的核心问题。用户行为分析不仅需要数据挖掘,更离不开数据挖掘中的Web挖掘。它具有很高的实用价值,尤其是在电子商务领域。本文分析了当前Web用户行为分析中的关键技术,Web使用挖掘,而Web使用挖掘的核心研究内容是Web日志中的兴趣关联规则和Web用户浏览模式的聚类算法。一方面,在用户兴趣关联规则的基础上,结合Web区域的划分,提出一种新的用户兴趣关联规则,这种兴趣关联规则来源于现今网络用户对区域的选择以及用户在页面上浏览所表现出来的不同兴趣程度,进而提出一种基于兴趣区域的使用挖掘算法。这种算法是通过点击流数据的加权计算,并通过页面浏览路径的兴趣度来提高单页面区域推荐的准确度。另一方面,在提出的用户兴趣关联规则基础上,需要为多组用户分类,以便针对不同类型的用户进行个性化推荐,研究了Web用户浏览模式的聚类算法:粗糙k-均值聚类算法和Leader聚类算法。这两种方法都存在着一些缺点,第一种方法的聚类准确率好,但是时间复杂度较大,第二种方法时间复杂度较低,但是聚类准确率不够理想。本文以模糊理论为基础,结合Leader算法,实现一种改进的基于Leader算法的用户浏览模式聚类算法。本文研究的两种方法都具有较高的实用性,在互联网站点及电子商务中都有比较大的用途,其创新点在于:1)详细分析用户的兴趣关联规则模型,并对现有模型做出改进,增加浏览区域兴趣度的概念,并进行细致的实验分析。2)对向前序列算法进行改进,提供用户的真实浏览记录,并在实验室网站提供的数据上做了详尽的分析,并做出推荐策略。3)提出一种基于Leader算法的Web用户浏览模式聚类的改进算法,并在实验中对算法的关键指标进行详细的分析评测,明确其意义和可行性。
其他文献
为了满足广大电力用户的需求,同时又要保证供电质量,因此随着电力技术的不断提高以及能源的开发利用,分布式电源在电力系统中越来越受到人们的重视并得到广泛的应用,但是,分布式电
《穆天子传》是一部重要的先秦史籍。郭璞首次为之作了全面、系统的注释。郭璞的《穆天子传注》用多样化的注释形式解说文本,其注中保留了丰富的先秦两汉时期的古籍资料和魏
<正>祖国的传统医学把不同颜色的食物或药物归属于人体的各个脏器:红色入心,青色入肝,黄色入脾,白色入肺,黑色如肾。可见,色彩与食物营养有密切关系,也对人体有不同的生理功
简述了立体卷铁心树脂浇注干式变压器的发展概况,对比立体卷铁心树脂浇注干式变压器与叠铁心树脂浇注干式变压器的优缺点,分析了生产关键环节。
语法化研究是当今语言学发展的一个趋向,单向性又是其中最为重要的一个假设性研究。本文着眼于日语"ところ"的语法化,通过对"ところを"ところで""ところへ"和"ところが"中"と
近年来,伴随着高校扩招在满足了国家对人才需要的同时,也带了很多的问题。人才数量的不断增长,导致就业岗位的相对紧张,不但给本科生的心理造成很大的影响,同样也给在校的研究生提
人乳头瘤病毒(human papillomavirus,HPV)主要经性接触传播,可引起宫颈、肛门、生殖器等部位的恶性肿瘤。在世界范围内,宫颈癌发病率目前居女性癌症的第二位,研制疫苗有效预
WLAN网络提供便捷互联网接入的同时,也因其传输介质的开放性容易受到专门针对802.11协议弱点的攻击而出现安全问题。如何检测、发现、定位这些设备,并对网络环境和攻击行为进行