【摘 要】
:
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,被信息产业界认为是数据库系统最
论文部分内容阅读
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,被信息产业界认为是数据库系统最重要的前沿之一,是信息产业最有前途的交叉学科。
支持向量机在解决小样本、非线性以及高维模式识别问题中表现出许多特有的优势,然而,数据挖掘经常面对的却是海量的数据。为了解决样本点过多导致训练速度太慢的问题,本文做了如下创新性工作:
(1)从减小训练集规模的角度出发,使用聚类技术来保持整个数据的分布特性,同时大幅减小训练数据集规模;
(2)对聚类结果进行边缘提取,保留分类边界附近的支持向量;
(3)使用边缘提取和聚类算法选择的样本点重构训练数据集,对新的数据集使用支持向量机方法进行分类。由于重建的训练数据集规模较小,所以训练程序就快了很多,同时也保证了分类的精确度。
文章共提出了两个新的算法:
(1)自适应约束模糊C均值聚类算法(ACFCM),它有效的克服了经典的C均值算法存在的需要预先知道初始聚类数目以及对初始聚类中心过分依赖的问题;
(2)基于聚类技术的快速支持向量机算法(FSVM),它在保证了分类精度的情况下,大大缩减了训练数据的规模,从而减少了训练时间,这就确保了支持向量机在数据挖掘这种大数据集情况下的有效应用。
文章对新的算法进行了仿真,通过和传统支持向量机算法进行对比,证实了快速支持向量机算法在保证了分类精度的情况下,大大缩减了训练数据的规模,从而减少了训练时间,这就确保了支持向量机在数据挖掘这种大数据集情况下的实用性。
其他文献
随着电力电子技术、微控制器芯片和交流电机先进控制技术的不断发展,永磁同步电机交流调速系统的控制性能日益提高,加之制造简单、效率较高,在工业机器人、数控加工设备、电动汽车等场合得到了广泛应用。为了拓宽永磁同步电机的调速范围以适应不同应用场合的需要,一种简便而有效的方式是对电机进行弱磁调速。本文首先分析了永磁同步电机弱磁调速的基本原理,并分别介绍了基于电压调节法和基于单电流调节器法弱磁控制方案的实现。
本文利用图理论,半群理论和Riesz基方法研究复杂一维波网络的稳定性问题,即讨论了网络在被施加控制后所形成的闭环系统的Riesz基性质,以及在不同顶点施加控制后受控网络的稳
盲源分离(Blind source separation, BSS)属于信号处理中需要解决的一个问题,是20世纪90年代兴起的一个研究热点,它指的是在对源信号和传输通道几乎没有可以利用的信息的情况
球磨机由于具有容量大、运行可靠、煤种适应性强、维护简单、检修费用低等优点,成为目前国内燃煤电厂制粉系统中使用最多的磨煤设备。理论研究和实践运行均表明:球磨机制粉系统的最优运行与球磨机筒内料位密切相关。目前,实际生产中主要采用差压法、噪音法、功率法等传统方法来检测料位,但是球磨机是一个多变量、非线性、强耦合、大延迟的对象,各参数之间耦合严重,单独采集其中某个参数来反映料位均无法获得理想的效果。数据融
要提高无人直升机飞行品质,实现全天候自主飞行,尚需对无人直升机建模和控制方法进行研究。本文以某新型单旋翼涵道风扇式无人直升机为研究对象,对该无人直升机建模、双发动
随着航天技术的进步,星球探测器将起到越来越重要的作用。在星球探测器发射前利用低重力模拟系统对其进行地面验证是必不可少的环节。本课题来源于承接的某航天院所科研项目,
近些年,各国家相关领域的研究学者们对计算机视觉技术做了大量的研究,并取得了很大的进步,从而推动了计算机视觉技术的发展。其中,作为核心之一的视频目标跟踪技术占有相当高
智能楼宇空调温度控制是一个富有挑战性及跨专业的复杂工程难题,涉及了控制、空气调节、机电设备、信息和通讯等多个领域。与常规PID控制相比,模糊控制以其独具的特点和优势
目前,风力发电的核心技术主要掌握在国外几家公司手中,国内厂家主要通过进口或合作的方式来引进风电机组设备,这一现实要求我国应尽快研制具有自主知识产权的风电机组设备,以加快风力发电装备国产化进程。控制系统是整个风电机组的核心部件之一,其性能直接影响着机组的效率、安全性和可靠性。本论文采用了基于CAN总线架构的风电机组控制系统,并独立设计开发了以ARM嵌入式系统为硬件平台,Linux操作系统为软件平台的
随着计算机视觉技术的快速发展,视频跟踪技术也得到了极大提高,目前正广泛应用于军事和民事等领域中。为了实现宽视场目标持续跟踪和目标细节的获取,本文设计了一种基于广角