【摘 要】
:
本文介绍了分类问题的研究背景、研究现状,着重分析了分类领域中具有重要意义的朴素贝叶斯算法、决策树算法、神经网络算法、K近邻算法和支持向量机算法,并讨论了他们的优缺点
论文部分内容阅读
本文介绍了分类问题的研究背景、研究现状,着重分析了分类领域中具有重要意义的朴素贝叶斯算法、决策树算法、神经网络算法、K近邻算法和支持向量机算法,并讨论了他们的优缺点。
然而,传统的分类算法在训练集和目标集的分布不同时分类效果欠佳,为了解决这一问题,近年来分类领域提出了迁移学习的概念,对于小样本问题和样本不平衡问题,迁移学习方法表现出良好的泛化能力。本文介绍了近年来迁移学习领域的研究成果,在分析三个重要的迁移学习算法的基础上,总结出迁移学习的基本思路。
在分析和总结前人工作的基础上,本文提出了一种基于支持向量机的迁移学习新思路。在该思路的指导下,本文提出了两种针对不同训练数据的迁移学习算法:KNN-SVM算法和KKZ-KNN-TSVM算法。这两种算法都是以待分类数据的分布特征为指导,对训练数据进行筛选,分别计算每个训练样本在训练时的权重,使得训练集与待分类集的相似度提高,从而达到迁移学习的目的。与以往的迁移算法不同,本文提出的算法在不引入辅助集的情况下,有效地提高了训练集与待分类集的相似性,在UCI的两个非文本数据集和20Newsgroups文本数据集上的实验表明,KNN-SVM和KKZ-KNN-TSVM算法都表现出良好的迁移特性,在相同的训练集和目标集上,其分类精度比不迁移的情况下分别提高了10.6%和14.31%。
其他文献
随着无线网络技术的飞速发展及移动设备的广泛应用,移动协同工作(Mobile CSCW)的出现成为传统CSCW发展的必然趋势。Mobile CSCW在体现其优势与价值的同时也存在一些不足。移
随着虚拟现实、3D打印等技术的迅速发展,三维模型广泛应用于场景建模,机器人导航,文化遗产保护等不同领域。许多这样的应用场景需要从现实世界中获取三维模型。传统的基于三
SOPC是以大规模FPGA为物理实现载体的片上芯片系统,是融电子电路技术、可编程逻辑器件、EDA技术、SOC、嵌入式系统、DSP、IP等为一体,集先进性、高效性、经济性于一身的新技术
针对现有ERP系统中存在的面向功能和流程固化方面的不足,本文提出了基于构件库的ERP系统。基于构件库的ERP系统开发方式是一种类似于“零部件组装”的集成生产方式,即从软件构
心脏的发育过程中是由一个小心血管开始的,通过研究小心血管的发育过程,可以帮助医学研究者分析先天性心脏病的形成原因,光学相干层析技术( Optical Coherence Tomography, OCT)由
面向对象分析和设计方法的出现,对软件领域的发展乃至软件的架构思想起了强大的促进作用,其思想已经超出了程序设计的范围,渗透到诸如软件工程,信息系统,工业设计等复杂的工
随着信息化程度的不断提高,各种院校、企业等团体的网络规模迅速扩大,并且在这些以太网平台上,各种大规模网络应用不断呈现,网络流量急剧增长。对于越来越复杂的网络环境,现
近年来,进化计算在处理复杂、非线性问题方面取得了较大的成功。特别是针对多目标优化问题,出现了许多多目标优化算法(MOEA),最具代表性的算法有NSGA2和SPEA2,这些算法一次运
面向web的数据挖掘是一项复杂的技术,Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息。Web上的信息五花八门,传统的Internet由各种类型的服务和数据源组
移动Ad hoc网络(MANET)是由一组带无线收发装置的移动终端组成的一个多跳的临时性自治系统。由于它不依赖固定的基础通信设施,没有中心控制节点,抗毁性强,因此适用于许多网络