基于加权修正的KNN文本分类算法

来源 :第二十五届中国数据库学术会议(NDBC2008) | 被引量 : 0次 | 上传用户：fallleaf

【摘要】

：

随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.KNN方法作为一种简单、有效、非参数的分类方法。本文分析了KNN算法在文本分类中存在的不足——分布密度

【作者】

：

沈志斌白清源

【机构】

：

福州大学数学与计算机科学学院福州350002

【出处】

：

第二十五届中国数据库学术会议(NDBC2008)

【发表日期】

：

2008年10期

【关键词】

：

文本分类加权修正 KNN算法分布密度训练样本数迭代

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.KNN方法作为一种简单、有效、非参数的分类方法。本文分析了KNN算法在文本分类中存在的不足——分布密度和训练样本数对KNN分类效果的影响,并针时这些不足,对KNN算法进行了改进.改进后的方法使训练样本的分布密度趋于均匀,降低了样本数的不均对分类效果的影响,提高了文本分类的准确率。实验结果显示,这种改进后的方法具有很好的性能.

其他文献

视频矩阵的网络化变革——嵌入式网络视频矩阵

网络化监控的发展，需要一套真正面向网络化应用的矩阵解决方案，在这种情况下，嵌入式网络视频矩阵应运而生。嵌入式网络视频矩阵充分考虑到了网络视频监控环境下的传输、解码、控

会议

视频监控网络化监控视频矩阵嵌入式网络图象解码

基于加权修正的KNN文本分类算法

其他学术论文