高维数据集中离群数据挖掘方法的研究

被引量 : 0次 | 上传用户:luyang123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离群数据的发现,往往可以使人们发现一些真实的、但又出乎意料的知识。离群数据挖掘是数据挖掘的一个新兴课题,在实际生活中有广泛的应用。目前,离群挖掘正逐渐成为数据库、机器学习、统计学等领域研究人员的研究热点。 由于高维空间中数据分布特殊,所以传统的离群数据挖掘方法不能很好的适用于高维空间数据集。本文针对这一问题提出了一种利用粗糙集的属性约简方法对数据集的属性进行约简以减少高维空间的维数,并在约简生成的子空间中对数据集进行基于超图模型的离群数据挖掘的方法。研究结果表明,对属性的约简可以节省数据存储空间,提高计算效率,而利用超图模型可以发现约简后的数据集中的离群数据。实验结果说明了此方法的高效性并且具有实用价值。 本文共分为六章。第一章“前言”简单介绍了数据挖掘的基本概念、方法以及分类等。第二章“离群数据挖掘概述”是关于离群数据挖掘以及常用的离群数据挖掘方法的介绍。第三章“粗糙集理论与数据挖掘”阐述了粗糙集的基本理论及其与数据挖掘的关系。在第四章“聚类分析”中,主要是聚类方法及其与离群数据挖掘的紧密联系。第五章“基于粗糙集与超图的高维离群数据挖掘研究”是运用粗糙集的属性约简方法和超图模型在高维数据集中进行离群数据的发现,并描述了实验过程和实验结果。最后一章是对全文工作的总结以及对今后研究工作的展望。
其他文献
近年来,随着中国现代化进程的步伐,物流已经引起了全球的重视,物流业已经成为一个新兴并且充满希望的产业。物流中心的选址研究也成为管理学的前沿问题。合理的物流选址可以
通过计算一些相容性预测参数可以判定悬浮PVC与十二种增塑剂间的相容性,其结果与精确测量情况吻合。单独用溶解度参数来区分与PVC相容性的好坏只对同种类型增塑剂有效,而结合
建立、健全个人征信体系是我国金融信息化建设的重要内容。有效可靠的征信体系,有助于降低银行对个人资信的调查成本,推动个人信贷业务健康持续发展,降低信贷风险,稳定金融秩
随着世界经济一体化进程的发展,以及全球运输设施和网络的改善,国际货运代理行业表现出前所未有的活力和潜力。在中国,虽然国际货运代理行业仅有二十多年的历史,但二十多年里
毛泽东教育与生产劳动相结合的伟大思想是培养社会主义建设者和接班人的根本途径牡丹江市立新实验小学高红岩结合我校坚持劳动教育的实际,深入学习毛主席关于教育与生产劳动相
法治思维是依法思考问题的认识过程,法治方式是法治思维外化为依法处理问题的行为方式。大学生法治思维的培育,不仅关系到自身的成长成才、家庭的幸福,也关系到法治社会建设
2019年7月16日黑龙江省人民政府办公厅发布关于印发黑龙江省百亿级企业成长行动计划等7个文件的通知,其中,《黑龙江省石油天然气等矿产资源开发及精深加工万亿级产业集群建设
由于软件开发的特殊性,使得软件开发控制成本过程中也具有一定的特殊性。怎么合理运用这些特殊性来完成开发项目的成本控制呢,成为信息产业过程中的一个重要的研究课题,因此,
汉民族本是一个安土重迁的民族,《汉书·元帝纪》载:"安土重迁,黎民之性。"但从世界几乎处处有汉民族的现实,从大的历史观来考察和反思汉民族移民的大走势后,我们不得不对汉
目的 探讨全麻诱导期间利用地佐辛抑制舒芬太尼诱发呛咳反应的效果。方法 选取我院2015年9月-2016年12月收治的96例行全麻气管插管手术患者展开研究,随机分为实验组(n=48例)和