概念格剪枝方法研究及其在Web挖掘中的应用

来源 :郑州大学 | 被引量 : 0次 | 上传用户:yisheng8585
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
形式概念分析是一种概念化知识处理的有效工具,现在已广泛应用于知识发现、软件工程、信息检索、数据库管理、Web挖掘等很多方面。随着网络的发展和数据库规模的增大,数据库中不仅包含了有用的信息,同时也存在大量的冗余信息,研究如何从中提取有价值的信息具有很强的实用价值。对于大型数据库来说,其产生的概念格往往节点众多、规模巨大,使得概念格变得难以分析,失去利用价值。为此,需要使用一些度量方法来缩减概念格的规模,使它更加清晰明确的反映数据库中的关键信息。论文研究了概念格的基础理论、概念格的构造算法,并对概念格的剪枝理论及其在Web挖掘中的应用展开了深入的研究。在本文中首先引入两种剪枝策略:支持度剪枝和稳定性剪枝。其中,对概念格进行支持度剪枝方法通过挖掘频繁项集的方法建立Iceberg:冰山)概念格,它却有可能隐藏了那些不频繁却具有现实意义的概念。而稳定性剪枝方法是根据概念格中概念之间的相关性来进行剪枝。然后,提出计算概念稳定性算法,并对概念稳定性理论进行了分析。最后,将形式概念的稳定性理论与Web挖掘应用相结合。将概念格应用于分众分类中,能够反映出这个社区的思维和认识,有利于各个社区的资源组织和利用,实验中将支持度剪枝和稳定性剪枝的概念格进行对比,表明稳定度剪枝能有效去除冗余信息并发现用户兴趣。
其他文献
当今社会是信息化的社会,信息量急剧.的膨胀,如何从大量数据中用非平凡的方法发现知识,已经成为信息产业界广泛关注的问题。数据挖掘可以从大量的信息中发现有用的信息和知识
随着现在信息技术的日新月异,检测技术在工业、农业、教育、医疗、企业、军事、有着广泛和重要的应用。但是由于信息技术不可避免的存在某种缺陷,目前很多检测问题存在无法测
随着信息技术的发展,流数据挖掘是数据挖掘中具有挑战性的问题之一。实时应用中通常会形成大量的数据流,比如传感网络中的传感数据,web中的web记录等等。传统“先存储后处理
随着社会的发展,世界各国掀起了建设高铁的浪潮。近年来,中国在高铁建设方面取得了举世瞩目的成就,为人类文明进步和社会经济发展做出了不可磨灭的贡献。因此,对列车运行的舒
随着机器学习和计算机视觉研究的不断发展,通过算法自动对现实世界里的目标物进行检测成为了可能。而在目标物检测领域内,人脸检测无疑是现实需求最大、相关研究最多的领域之
随着无线充电技术的发展,我们能为无线传感器网络中的传感器节点进行充电并让网络持续运行。同时数据收集一直是无线传感器网络研究的热点。传统的数据收集方式是传感器节点
在信息技术朝着高性能、多样化、普适化和智能化等主要方向持续发展的今天,因特网上的多媒体业务变得多种多样。组播通信能够很好地解决多个用户的接收问题,其实质就是针对个
Web技术的快速发展使微博成为人们进行沟通与交流的一种新型社交网络平台。在该平台上,用户可以自由地发表对某些话题的观点与看法。微博内容简单、发布容易的特点使其每天产
网络技术,数据库及数据仓库技术的飞速发展使得数据大量堆积,为从大量数据中发现隐含的知识信息,数据挖掘技术得以出现。随着数据量的急速增长及人们对隐含知识的迫切需求,数
为解决基于身份密码体制的密钥托管问题,2003年,Al-Riyami和Paterson提出了无证书公钥密码体制。无证书公钥密码系统和基于身份的密码系统一样,无需CA颁发的数字证书来认证公