基于样本差异性的关联文本分类

来源 :第三届全国信息检索与内容安全学术会议 | 被引量 : 0次 | 上传用户:xuezhenlong0310
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在关联文本分类算法ARC-BC中,往往采用人工收集训练样本的方法,由于人工方法的主观不确定性使得收集到的训练样本的质量有差异,使得分类器的分类效果受到影响。本文提出了一种根据训练样本偏离“真实类中心”的程度——离心度,给训练样本赋予权值的算法WS-ARC-BC(Weighted SampleARC-BC),提高分类器的稳定性,从而提高分类器的分类效果。实验表明,该算法能够有效提高分类效果。
其他文献
目前,果树生产中喷洒农药是防治害虫的主要手段,然而果园中发生的害虫和广泛存在的害虫天敌,在长期的进化过程中,逐步形成了相互依存、相互制约的生态平衡关系。在农药防治害