【摘 要】
:
序列模式挖掘是数据挖掘技术中一个非常重要的研究课题和领域,旨在从有序事件的数据集中发现有规律的序列模式。概念格作为从数据中进行概念发现的一种数学工具,能够较好地展
论文部分内容阅读
序列模式挖掘是数据挖掘技术中一个非常重要的研究课题和领域,旨在从有序事件的数据集中发现有规律的序列模式。概念格作为从数据中进行概念发现的一种数学工具,能够较好地展现概念之间的层次关系。本文分别介绍了序列模式挖掘和概念格的基本理论和主要研究成果,并将研究重点放在应用概念格思想进行序列模式的有效挖掘上。首先,通过引入顺序约束,提出新的有序概念格模型,在其基础上,给出Web用户访问模式的增量挖掘算法,得到了较好的实验结果,验证了有序概念格模型的有效性。其次,将有序概念格与多维访问序列相结合,进一步拓展有序概念格模型使之能够处理压缩形式的多维访问序列,从而设计并实现多维访问序列模式的挖掘算法。第三,针对具有一个或多个有序及无序信息维的多维序列模式挖掘应用,提出多维概念格模型,设计了基于该结构的增量式多维序列模式挖掘算法。该算法使用统一的数据模型实现关联模式与序列模式的高效同步挖掘,在标准合成数据集和实际金融数据集上都取得了令人满意的结果,为解决复杂序列模式挖掘问题提供了一条新的途径。最后,在多维访问序列模式挖掘和多维序列模式挖掘研究工作的基础上,提出新的更为广义的多维序列挖掘应用主题,给出了与该应用相关的基本概念的形式化定义。同时,针对该应用的特点,设计实现了三种有效求解该问题的算法,并基于合成数据集上的实验结果给出算法性能和优缺点的客观评价。
其他文献
本研究从知识模型角度,以电子病历形式构建脾虚证的数据采集系统。系统以VISUAL BASIC6.0、VBA、SQL SERVER2000为工具,参考《脾虚证消化吸收障碍亚型的功能基因谱与模式识别
绿色经济建设是人类发展到当今时代的必然产物,它与信息传递模式的进步息息相关;当前学术界已经就互联网发展趋势进行了广泛的研究,并取得可观的科研成果;但对于绿色经济建设的研
通过对江西省金溪县象山公园现状的分析,研究了象山公园规划设计目标和相应的技术措施,包括对公园各景区的综合布局、景观设计及园林植物配植设计等方面内容,以期为象山公园
基于物联网的虚拟实验室是对传统实验教学模式的革新,具有显明的技术特点,十分适合现代人才培养模式,在高等院校实验实践教学中具有广阔的应用前景。针对智能电网电力通信虚
嘉兴马家洪遗址的发掘已经四十年了。作为当时马家洪遗址发掘的参加者、发掘资料的整理者和发掘简报的执笔者之一,有幸参加纪念马家浜遗址发掘四十周年座谈会感到非常高兴,感谢
纸质乐谱向数字化乐谱的转换,是人类音乐活动与计算机音乐处理之间进行信息交流的必经之路。光学乐谱识别是将纸质乐谱扫描输入计算机后,对乐谱图像加以处理、识别、分析,最终获
墙地砖的颜色分类是墙地砖生产过程中最后一道重要工序。目前,由于技术原因,这一工序仍然停留在手工操作的水平,存在主观性强这一主要问题。因此,研究出墙地砖颜色的自动分类算法
逼真、高效地表现对象是实现虚拟环境系统真实感的关键问题之一,在复杂虚拟环境中,基于几何模型的对象表现常常受到对象建模与绘制复杂性的限制。本文将基于图像的建模与绘制
现代社会科学技术发展迅速,经济也快速向前,每一个行业的基础设施建设都趋向稳定,同时,时代的快速发展使得对基础设施的质量有了更高的要求。机电安装工程和电气施工成为我国