【摘 要】
:
该文首先介绍了序列模式挖掘的基本概念及其发展方向,然后提出了序列模式挖掘的一个新的算法——CSE算法.提高序列模式挖掘算法的性能,最主要的是减少数据库查询和I/O操作,CS
论文部分内容阅读
该文首先介绍了序列模式挖掘的基本概念及其发展方向,然后提出了序列模式挖掘的一个新的算法——CSE算法.提高序列模式挖掘算法的性能,最主要的是减少数据库查询和I/O操作,CSE算法通过记录频繁序列位置,使用前缀序列,充分利用上一次循环的结果,使得多个候选序列(相同前缀)可以在同一个数据序列中同时进行序列模式匹配,同时也大大简化了模式序列匹配的过程.要从Web Log中找出用户的访问规律,必须首先知道Web Log是如何反映用户的访问过程的和用户对网页的兴趣程度.该文中我们给出了新的用户访问过程的描述和用户兴趣程度的计算方法;对Web Log进行数据预处理的时候也采用了一些新的思路,例如去掉"偶然"访问的用户的访问信息,识别页面视图的精确化方法等.我们采用了一个星座型多维数据模型建立存储Web Log数据的数据集市 ,并对其进行OLAP分析.在对Web Log的序列模式挖掘结果进行分析时,为了更好地预测用户的访问模式,我们首次采用了序列模式挖掘中的置信度的概念.
其他文献
ACD是呼叫中心系统中的一项关键技术,ACD的性能直接影响到了整个系统的呼叫分配情况.该文将着重分析外置ACD的工作原理、原有外置ACD模块的瓶颈及其优化原则,并通过ACD优化前
数据挖掘(DATA MINING)是当前较为关注的一个研究领域,关联规则是数据挖掘所能发现的重要知识模式之一。从海量的信息数据库中挖掘出人们感兴趣的、有用的规则,对人们在生产、
人类社会已进入信息时代.信息技术的迅速发展加快了制造企业的现代化与信息化的进程.计算机技术与管理科技的结合促进了现代企业管理技术的形成.现代企业管理技术的目的是通
无线传感器网络是由分布在一定范围的大量传感器节点组成,各节点间多以无线多跳的无中心方式连接,能够协作地感知、采集和处理网络覆盖区域内目标对象的信息,并返回给观察者
目前,软件开发的整体趋势是采用分布式组件技术建立面向对象的、基于网络的、分布的和异构的大规模应用系统,把整个软件系统划分为一个个相互独立的组件,每个组件完成特定的功能
该文探讨人们一直关注的问题:如何构建高效、高质量地传输包括数据、多媒体及实时业务在内的综合业务宽带通信网络,并研究作为解决问题有效途径之一的多协议标记交换(MPLS)中
远程教育作为现代教育技术的形式,有效地牵引着教育资源的优化,给教育思想与技术带来了革命性的变革,已经成为现代教育的必然要求。远程教育要得以顺利、高效的实施,必然离不开高
随着Web2.0的深入发展,社会化标注系统不断普及,标签这一应用受到越来越多用户的关注与使用。标签是对资源的进行描述的词或词组。用户可以随意选择标签对资源进行标注,而不
该文通过分析飞机模线图这一具体的海量工程图的特点,从减小时间复杂度和空间复杂度入手,对这一类的工程图即海量工程图进行矢量化研究.因此,该文中对现有的二值化算法、细化
该文研究的内容是各种随机噪声下的语音流检测.所用的实验数据来自真实现场的录音.涉及噪声种类繁多,如脉冲噪声、周期噪声、高斯噪声(白、有色)、非高斯噪声及其更为复杂的