不确定数据频繁闭项集挖掘算法

来源 :计算机应用 | 被引量 : 2次 | 上传用户:kerrytony
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于不确定数据的向下封闭属性,挖掘全部频繁项集的方法会得到一个指数级的结果。为获得一个较小的合适的结果集,研究了在不确定数据上挖掘频繁闭项集,并提出了一种新的频繁闭项集挖掘算法——NA-PFCIM。该算法将项集挖掘过程看作一个概率分布函数,考虑到基于正态分布模型的方法提取的频繁项集精确度较高,而且支持大型数据库,采用了正态分布模型提取频繁项集。同时,为了减少搜索空间以及避免冗余计算,利用基于深度优先搜索的策略来获得所有的概率频繁闭项集。该算法还设计了两个剪枝策略:超集修剪和子集修剪。最后,在常用的数
其他文献
针对复杂环境下的深度图像手势特征提取信息冗余量大、编码不稳定等问题,提出了一种改进的基于曲率局部二值模式(LBP)的深度图像手势特征提取算法。该算法首先通过坐标转换将分
在当今时代,社会化媒体的介入使得收视率调查突破传统的界限,点播、回看、IPTV、OTT、网络电视等各类渠道和终端的观众与收视数据,都将陆续被聚合到大收视体系中,应用大数据
当前,人们已经迈进了信息化时代,电子档案也随之产生,因此原先的文书档案管理模式面临着较大的挑战。办公的自动化水平逐渐提升,文书档案的管理方式已经阻碍了高效率办公,需
对已完成的电厂建设项目进行科学评价、总结经验、汲取教训并分清责任,在以后的电厂项目建设中不断提高决策水平和管理水平,使有限的资源得到最佳配置,这些都是我国当前电厂
7月11日,工信部对全国2011年18个工业行业淘汰落后产能企业名单、淘汰落后生产线(设备)及产能进行了公告,接受社会监督,并要求各地采取有效措施确保列入公告名单的2 256家企业
随着信息化的不断发展,传统的图书馆管理模式显然已经不再能够满足广大人民群众的精神文化需求,想要进一步发挥图书馆文化枢纽的核心作用,图书馆信息化建设已经势在必行。本