基于KNN+层次SVM的文本自动分类技术

来源 :计算机应用与软件 | 被引量 : 15次 | 上传用户:xiaobangzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对大规模文本的自动层次分类问题,K近邻(KNN)算法分类效率较高,但是对于处于类别边界的样本分类准确度不是很高。而支持向量机(SVM)分类算法准确度比较高,但以前的多类SVM算法很多基于多个独立二值分类器组成,训练过程比较缓慢并且不适合层次类别结构等。提出一种融合KNN与层次SVM的自动分类方法。首先对KNN算法进行改进以迅速得到K个最近邻的类别标签,以此对文档的候选类别进行有效筛选。然后使用一个统一学习的多类稀疏层次SVM分类器对其进行自上而下的类别划分,从而实现对文档的高效准确的分类过程。实验
其他文献
期刊
在教育改革的影响下,核心素养成了教育中的重点。所以在初中化学实验教学中,要从学生的终身发展上入手,在关注学生个人修养的基础上来满足学生的发展需求,实现教育的目标,让
在科学考察中,数据的获取受自然环境因素以及监测成本影响较大,实际布放的监测点的数量和位置可能无法达到预期,并且所采集的数据集中通常包含了多种监测要素,利用数据分析来弥补因自然环境影响而造成的数据缺失并找出数据变化规律显得尤为重要。以南极普里兹湾水文数据为研究对象,利用空间插值的方法,来弥补数据不足和监测点稀疏的问题,再将改进的动态时间弯曲距离算法用于具有多要素特性的水文深度序列相似度衡量,实验结果
南口农场2000年购进凯斯2555型采棉机5台,种植机采棉面积133.3hm^2。2006年全场机采棉面积扩大到6666.7hm^2,对机采棉加工设备、厂房进行改造,加快了采棉机械化的步伐。
为了提高载人航天器GUI的可靠性和安全性,提出一种基于焦点队列的GUI自动测试方法。该方法首先确定GUI系统的所有界面状态并得出相应的窗口家族树,据此得到当前界面的可聚焦
信息化时代为多媒体技术的发展带来了许多机遇.传统的媒体,例如:电视、广播等的使用频率在不断降低,因此广播电视媒体就需要和新媒体契合,以帮助自身较快发展。本文首先讲述