序列模式挖掘研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:gaolei000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
序列模式挖掘是数据挖掘的一个重要分支,在金融通讯等领域应用中,序列模式挖掘发挥了重要的作用。虽然到目前为止,关于序列模式的挖掘算法已经相对成熟,但绝大部分算法都是面向静态序列数据的,而现实中的数据总是不断更新的,如何在序列模式增量式挖掘中提高时空效率成为当下序列模式挖掘中一个重要的研究课题,文章在分析了序列模式挖掘特点提出了针对序列模式增量式挖掘的方法。同时,随着数据挖掘中隐私保护问题日益突出,序列模式挖掘中的隐私保护也显得异常重要,为此,文章也提出了一种解决序列模式挖掘中隐私保护的方法。针对序列模式增量式更新挖掘算法产生大量候选项集以及多次扫描数据库的问题,提出了一种有效的增量式更新算法SPIU2SM,该算法利用基于2-序列矩阵挖掘算法ESPE对原数据库和增加数据库一次扫描产生序列模式,利用2-序列及2-序列矩阵对序列数据进行重新编码,降低了更新算法的空间复杂度,在此基础上通过对频繁模式和非频繁模式进行相应的剪枝减少了序列的比较和扫描次数,降低了更新算法时间复杂度,实验结果表明该算法是有效的和准确的。针对序列模式挖掘中隐私保护采用随机隐藏算法需要对原始数据作大幅改动带来的弊端,提出了基于序列模式挖掘的隐私保护算法PPSM,一方面该算法通过对需要隐藏的敏感序列模式集的预处理,降低了算法时间复杂度,另一方面通过搜寻共同支持交易列作为优先修改删除项,减少对原始序列数据的修改,从而提高算法的执行效率,降低对原始数据的修改比率。实验效能分析和实验结果表明,该算法是有效的和正确的。
其他文献
随着数字信号处理技术和嵌入式技术的快速发展,嵌入式DSP系统在应用领域越来越广泛。与此同时,嵌入式DSP系统也越来越复杂,开发周期和开发成本占据的比重越来越大。传统DSP软件
在云计算和大数据的时代大潮中,分布式块存储系统以它特有的优势而变得愈发重要。负载均衡是分布式块存储系统的重要特性,也是当前分布式块存储研究的热点之一。以现有的负载
当前的视频监控系统,结构复杂,成本高昂,且非常不灵活,本文结合市场上流行的ARM9嵌入式芯片为主控处理器来构建网络视频监控系统,可以在结构实现上大大简化。视频监控系统的
随着主动服务技术的不断深入研究,各项主动服务的关键性技术已经得到研究者们的实现以及优化,如构件注册检索、程序挖掘、多智能代理、构件组装发布等。然而,如何架构一个主
本文主要基于虚拟现实技术来构建虚拟场景并使其得到优化,首先介绍了虚拟场景的概念和关键技术,针对国内外的研究现状和进展,在结合OpenGL技术介绍,共同讨论并研究了虚拟场景
随着社会城市化的发展,数字城市对城市发展的促进作用也越来越明显,而三维建模是数字城市系统的基础。大规模城市建模往往需要投入大量的人力、物力和财力。高效率、大批量、
BLAS(Basic Linear Algebra Subprograms)定义了一组基本的矩阵和向量的操作,包括各种矩阵乘法和矩阵向量乘法,在许多领域有广泛的应用。现在的GPU已经发展为一种多核,多线程
数字图像具有形象、生动和直观等优点,己成为信息表达的主流方式之一,但在传输过程中也存在着诸多的安全隐患。因此,数字图像信息的安全问题己成为人们关注的焦点之一,研究图
现代汉语副词用法自动识别是面向自然语言处理的现代汉语副词知识库研究的重要内容之一,针对基于规则的现代汉语副词用法自动识别方法存在的不足,本文在已有工作的基础上,进
网络拓扑发现算法和实现技术是衡量网络管理系统性能的一个重要方面。本文通过开发网络管理系统网络拓扑发现服务模块过程中获得的理论和实践经验,从物理拓扑算法进行了积极的