【摘 要】
:
海量数据利用传统Apriori算法进行挖掘会浪费大量存储空间和通信资源,导致算法效率低下,因此,提出MapReduce框架下Aprioi算法的改进方法,首先采用水平划分的方法将MapReduce
【机 构】
:
黑龙江工程学院计算机科学与技术学院
【基金项目】
:
黑龙江省自然科学基金项目(F201224)
论文部分内容阅读
海量数据利用传统Apriori算法进行挖掘会浪费大量存储空间和通信资源,导致算法效率低下,因此,提出MapReduce框架下Aprioi算法的改进方法,首先采用水平划分的方法将MapReduce数据库分成n个独立的数据块,然后发送到采用动态负载均衡划分的m个工作节点上。每个节点扫描各自的数据块,产生局部候选频繁项集,计算每个候选频繁项集的支持度阈值并与最小支持度阈值进行比较以确定最终的频繁项集。改进后的算法可以减少各个节点之间的数据流动,只需要扫描两次事务数据库就能挖掘出全部频繁项集,节省扫描时间和存储空
其他文献
最近,我有机会观摩了我县小学语文学科带头人、教学能手共二十位参评教师的课堂教学,看到几乎所有教师都运用了以视听多媒体教学为主体的现代教学技术,但大部分效果不尽如人意。
本文分析了基于虚拟机构建计算机网络实验平台的关键实现方法,并对该平台的实际应用情况进行介绍。构建的平台能实现各种操作系统和网络设备的虚拟,在该平台上能够完成各种计算
本文通过对目前高校已经建设完成的各种网络资源的分析,提出了一套实用的信息整合方案。高校电子资源综合利用系统以信息集成技术和数据仓库、文本分类、关联规则等信息增值
本文通过对浙江几个大学城信息资源共享的现状调查,就目前我国大学城信息资源共享难以实现的原因进行了较详细的分析总结,并提出了构建大学城信息资源共享体系的设想。
【正】天行健,君子自强不息;地势坤,君子厚德载物。“自强不息、厚德载物”是清华精神,亦是清华附中的校训。清华附中东依美丽的清华园,西临著名的圆明园,90年的历史让清华附