【摘 要】
:
许多机构和社团(如现代化企业、股票公司、广告公司、Web服务中心等)在每天的日常工作中经常制作和收集大量的数据,从大量存储在网络服务器的访问日志中原始的半结构化数据中挖
论文部分内容阅读
许多机构和社团(如现代化企业、股票公司、广告公司、Web服务中心等)在每天的日常工作中经常制作和收集大量的数据,从大量存储在网络服务器的访问日志中原始的半结构化数据中挖掘出有意义的用户访问模式及相关潜在顾客群,是现代企业发展电子商务的重要支撑技术之一。本文针对Web用户访问模式问题(路径游历问题)提出了一种新的挖掘用户频繁访问路径的方法MFP(Maximal Frequent Path),该方法可以挖掘出更有意义的模式。同时提出了WUAP-tree结构并采用E-OEM模型,综合考虑了页面拓扑结构及用户浏览路径等多个数据源,提出了Web访问模式挖掘算法WUAP-mine。该算法采用WUAP-tree结构,不用产生候选集和递归的方法,只对事务数据库进行一次扫描,对WUAP-tree结构进行深度优先遍历一次,即可从WUAP-tree结构上直接查询出Web用户频繁访问模式,并从理论和实践上推导和验证了它的有效性和高效性。
其他文献
本文研究了任意矩形组合截面二步法三维编织的纱线布置规律,并在此基础上利用Microsoft Visual C++ 6.0开发了一套二步法三维编织的计算机辅助设计系统。当前,二步法三维编织的
该文所研究的内容为新一代的监控系统,其目的在于建立真正的基于视频内容的(场景中的运动目标)智能监控系统.该论文主要创新性工作可以总结如下:首先,在监控系统的架构方面,
随着计算机软件技术和企业信息化的发展,企业应用软件系统规模和复杂性不断增长.目前的软件开发手段相对滞后于企业对信息系统的需求,需要采用工程化的方法开发企业的信息系
该文的主要目的是通过对软件体系结构的研究,寻求基于软件体系结构的领域开发方法,应用于供应链管理系统,验证其价值.首先从软件体系结构的要领模型入手,分析其组成,包括构成
随着移动通信已经不断地融入到人们的日常生活当中,我国的移动通信系统从第二代移动通信系统(2G)发展到第三代移动通信系统(3G)将是一种必然趋势,同时,人们也越来越关心通信
目前的手机类似于掌上电脑,能够运行各种新型应用.市场上要求手机小巧轻便、低功耗和低价格,因此对手机的存储空间和处理速度有严格的限制.随着无线通信技术的迅猛发展和无线
该文密切结合企业信息需求,研究基于智能代理的供应链管理系统模型,取得了如下成果:△在详细分析动态供应链管理对信息系统需求的基础上,引进代理以及移动代理的概念,分析了
汉语自动分词是中文信息处理中的重要环节。基于统计的汉语自动分词方法存在训练数据稀疏的问题,而人工标注工作量过大又制约着语料库规模的进一步扩大。 本文在基于统计的
Internet和移动通信是目前信息技术的两大热点技术,移动互联网正是这两大热点技术的结合,而可移动的个人多媒体通信业务则被认为是未来信息交流的主要特征。本文首先介绍了无线
联机分析处理(OLAP)是一个重要的数据库系统的应用。通常OLAP数据呈现为多维数据立方体。OLAP的查询一般是复杂的,并且如果在原始数据上执行,可能要花费几个小时甚至是几天时间