【摘 要】
:
近几年,数据挖掘领域涌现出一种的新研究课题—数据流挖掘。在许多实际应用中,如股票分析、网络故障监测、信用卡欺诈领域得到了广泛的应用。数据挖掘研究领域里分类挖掘是其
论文部分内容阅读
近几年,数据挖掘领域涌现出一种的新研究课题—数据流挖掘。在许多实际应用中,如股票分析、网络故障监测、信用卡欺诈领域得到了广泛的应用。数据挖掘研究领域里分类挖掘是其中重要的分支之一。现在成熟的数据流分类挖掘算法有:基于Hoeffding树的VFDT、适应概念漂移的CVFDT、集成分类器Ensemble Classifiers、VFDTC等。其中,集成分类方式被广泛应用在数据流分类挖掘领域。数据流的特点之一—概念漂移,是当今所有数据流分类算法必须面对的最大的挑战。分类算法性能的高低,取决于其适应概念漂移的能力。如今大多数性能优越的分类算法均采用集成分类方法。本文首先阐述了数据挖掘理论的相关知识,详细介绍了经典数据流分类算法EC4.5,以及概念漂移的概念。与EC4.5相比,CEEPCE算法提高了分类的准确率,但仍存在适应概念漂移能力不足的问题。本文提出的适应概念漂移的数据流分类算法基于集成分类器的构造、淘汰、更新、以及差异性加强等因素来优化分类性能。首先,介绍了基分类器的构造方式,结合eEP的特性构造出有较高区分度的基分类器。其次,给出了分类器的淘汰标准,根据基分类器的分类误差率进行淘汰。此外,根据算法CEEPCE提出了两点改进。第一次改进提出了基于分类误差权值的差异性加强方法,从而提高了集成分类器的分类精度。在保证基分类器分类性能的前提下,通过差异性加强方法提取最终的分类器集合。第二次改进对集成分类器的更新方式进行优化,更新时根据分类器的平均错误率与随机分类错误率的比较,选择是否加入相反分类器,这种验证方式虽然在时间效率上有所降低,但面对大数据量的分类时,其适应当前概念的优越性将会体现出来。
其他文献
在智能监控领域,复杂背景下的人体跟踪是一项具有挑战性的工作。各种不利因素,如杂乱的背景、光照的改变以及遮挡,都极大影响人体跟踪的准确性和鲁棒性。本文提出在跟踪过程
信息化时代,企业的信息管理程度不断深入,水平也日益提高,这大大冲击了传统的制造业,让传统的制造业摒弃了许多以前陈旧的管理理念。此外,通过信息化技术降低了企业的运作成
随着科技的迅猛发展,数字化时代的迈进,混合式学习越来越受到教育界和工业界的瞩目。交互式电子白板凭借其丰富的学习资源,方便快捷的操作步骤,多姿多彩的教学方式和安全环保
互联网的快速发展,尤其是Web 2.0的兴起,为人们提供了丰富大量的信息资源,人们在畅游信息海洋的同时,“信息过载”给人们带来的困惑也越来越多。面对大量的信息,人们往往无从
本文对全景图像拼接过程进行了阐述。结合全景同步拍摄装置的特点,本文采用摄像机标定的方式来消除镜头畸变,完成图像预处理工作。在图像拼接过程中本文采用改进的模板匹配算
军事仿真技术作为一门实用性学科,凭借其独有的风险低、效果好、投入少、可重复等优点,已经受到普遍关注,得到广泛应用。为了辅助新型武器研制,评估决策效果,缩减军费开支,人们开发
计算机网络尤其是Internet的发展奠定了新经济时代的信息基础。计算机网络已经改变了人们工作和生活的方式。在日益成熟的网络及通信技术的支持下,计算机网络迅速发展,网络规
数据挖掘是一门从大量的日常业务数据中提取隐含的同时又是有用的信息的新兴技术.数据挖掘算法对其处理的数据集合一般都有一定要求,比如数据完整性好、数据冗余性少、属性之
为了解决Web上信息增长给用户带来的一系列问题,Tim Berners-Lee提出了语义Web的概念。在语义Web中,信息被赋予定义完好的语义,能够被计算机理解和处理。本体(Ontology)是领
随着计算机视觉技术的发展,人脸检测和跟踪技术获得了广泛的重视,并成功应用于自动人脸识别、智能人机交互、视频会议等领域。与此同时,随着机器人技术的发展,人与机器人之间