一种面向数据流的频繁项集挖掘算法

来源 :昆明理工大学学报:理工版 | 被引量 : 0次 | 上传用户:ivyjiawx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与传统静态数据库中的数据不同,数据流是一个按时间到达的有序的项集,这使得经典的频繁项集挖掘算法难以适用到数据流中.根据数据流的特点,提出了数据流频繁项集挖掘算法FP—SegCount.该算法将数据流分段并利用改进的FP—growth算法挖掘分段中的频繁项集.然后,利用Count Min Sketch进行项集计数.算法解决了压缩统计和计算快速高效的问题.通过和FP—Ds算法的实验对比,FP—SegCount算法具有较好的时间效率.
其他文献
企业的竞争。归根结底是人才的竞争。而人力资源的开发,是提高企业竞争力的有效手段。现代企业新设备、新工艺更新换代,新产品层出不穷,需要员工不断吸收新的知识和技能.以适应企
选取广州市海珠区果树保护区20世纪90年代(1:50000)地形图,1998年和2004年(1:25000)二期土地利用现状图为基本信息源,在MAP—INF07.0支持下,提取基本数据,通过对景观格局指数的计算和分
土地利用直接改变土壤侵蚀的方式和强度,具有突出的侵蚀环境效应.以黑惠江流域为例,探讨了滇西高山峡谷区土地利用对土壤侵蚀的影响.研究表明,本区土地利用内部转化以林地转化最为
滇东沉积磷块岩矿床是云南省重要的磷矿石资源地,东川区绿茂乡麻栗坪磷矿区地质研究程度低,矿山开发利用程度不高.结合区内的详查工作,系统阐述了矿区的成矿地质背景、矿区地质、
当前.我国政府网站正处于努力建设服务型政府网站的过程中.而政府网站的特性决定了其提供的服务应该兼顾全体社会成员的需要.尤其应该兼顾广大残疾人获取、利用政府信息的需要。
针对昆钢6号高炉(2000m^3)炉缸炉底情况,应用传热学原理,开发了对炉缸炉底侵蚀状况进行监测的二维数学模型.通过对模型的计算,得到了炉缸炉底的温度场分布,从计算所得到的侵蚀图来看