【摘 要】
:
随着信息化时代的到来,信息以几何级数的方式增加,人们希望从纷繁冗杂的信息中快速地提取出有用的数据。为了更快的找寻出有效的数据,就需要借助于更为有效的分类方法。鉴于
论文部分内容阅读
随着信息化时代的到来,信息以几何级数的方式增加,人们希望从纷繁冗杂的信息中快速地提取出有用的数据。为了更快的找寻出有效的数据,就需要借助于更为有效的分类方法。鉴于支持向量机的分类方法具有推广能力强、能找到全局最优等优势,使它成为学者们关注的焦点。在运用支持向量机的过程中,由于数据集规模的不断增加,模型在训练时间上仍不能满足人们的需求,因此本文针对支持向量机的众多训练算法中运用最为广泛的序贯最小优化算法(SMO)进行了一系列的改进工作,并提出了一种综合改进策略来弥补训练时间上的不足。所做的工作内容如下:第一,针对标准的SMO算法存在的不足,本文提出一系列的改进策略,包括有通过跳过部分非支持向量来缩减训练集规模,松弛KKT条件来收缩工作集,提前结束不必要的循环来提高算法的训练速度等3个步骤。在保证一定精度的前提下,这些策略能有效的克服训练时间过长的不足。第二,考虑到训练集可能并不完备,仍会有数据不断加入到训练集中导致训练集规模的不断扩大,本文提出了一种基于SMO的增量学习方法,该方法改进了标准SMO算法以适应增量学习,用KKT条件来判断新增样本,并对不满足条件的样本与支持向量一同训练,保留了学习的历史性,也体现了学习的延续性,通过增量学习来减少训练时间。第三,将增量学习方法与前面的改进SMO的策略相结合,在增量学习的模型训练过程中把改进SMO的策略加入其中,达到两者优势互补,形成了一种综合优化的新策略来更有效的提高算法的训练速度。通过使用UCI数据集上的部分测试数据对本文提出的改进策略、增量学习方法、综合优化策略进行测试和对比,实验结果良好,从而表明了这一系列的策略能够在精度变化不大的前提下明显地提高支持向量机的训练速度。
其他文献
近年来,随着多媒体技术以及网络技术的快速发展,多媒体数据急剧增加。由于视频的低层特征与人类思维中的语义概念之间存在语义鸿沟,基于语义概念的视频检测技术已成为多媒体分析
随着人类社会的不断发展与进步,人类对自然资源的索取与破坏不断加剧,生态环境的恶化严重威胁着人类的生存与发展,生态安全问题引起了社会各界的广泛关注。生态安全预警作为
P2P(Person-to-Person)网络借贷是近年来出现的新兴事物。在网络借贷平台上,借贷双方不需要以银行等传统金融机构为中介,直接通过交易无担保借贷。美国最大P2P网络借贷平台Pros
随着互联网的普及和发展,Web网站已经渐渐成为各行业对外界宣传、传递信息最快捷方便的渠道。美观的Web界面设计直接影响着网页的视觉效果及宣传力度,而网页中最重要的一部分
植物作为自然界的一个重要组成部分,是人类生存和发展的物质基础。随着计算机图形学和虚拟现实技术的发展,利用计算机对植物进行建模和仿真成为人们研究的热点问题。植物种类繁
随着日益增多的软件需求,一个个软件应运而生。但是真正能达到用户要求的软件却很难完成。其原因有很多方面,工期的限制,软件可扩展性,需求的随时变动等都会为软件的完成增加
随着人工智能技术的快速发展,在不远的将来智能产品将走进千千万万普通人的生活中,行业内学者认为未来的50年内社会社会上一半的工作将由人工智能完成。在人口老龄化日益严重的
Ad Hoc网络是一种比较特殊的无线移动网络,这种网络中没有设置任何控制中心的节点,每个节点既可以当终端又可以做路由器。它有个比较突出的特点:能够在比较恶劣的环境下临时组
随着社会的快速进步,减少环境污染和解决能源紧缺问题已成为我国面临的重大挑战。优化能源结构、大力利用和开发清洁能源已经成为未来社会的发展方向。这些清洁能源的分布往往比较分散且远离主电网,采用传统的交流输电技术或者传统的直流输电技术进行传输,不仅会污染环境,成本上也会很不经济。柔性直流输电(即HVDCFlexible)技术作为国内外比较先进的新型直流输电传输技术,能很好的解决清洁能源分布分散的问题,并
随着Internet的快速发展,越来越多的应用程序需要集成在Internet中。信息在网络上进行传递,需要适应不同的网络环境,在不同的网络平台之间实现信息的兼容。WebService是基于网络