中文文本分类中特征选择方法的比较研究

来源 :科技信息 | 被引量 : 0次 | 上传用户:liubo200987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类的主要任务是在预先给定的类别标记集合下,根据文本内容判定它的类别。特征选择是文本分类中的一个重要环节。本文对文档频率(DF)、信息增益(IG)、互信息(MI)、矿统计量(CHI)四种特征选择方法在中文语料上进行了性能比较。实验结果表明IG方法较其它三种方法有一定的优势。
其他文献
2001年4月28日我国颁布了《国防教育法》,并规定每年9月的第二周周六为全国国防教育日。《国防教育法》第二章学校国防教育第十三条提出:"学校的国防教育是全民国防教育的重
期刊
目的 探究多种手术方式在肺癌手术中的应用效果.方法 本次研究96例肺癌患者根据自愿原则均分为研究组与对照组,对照组行传统肺癌手术治疗,研究组则采用行改良后外侧小切口术
音乐教育应适应现代社会的要求,对教学对象进行创新型教学,音乐教育的创新教学应从教育理念、教学内容、组织形式、教学手段以及教学评价几个方面入手。
针对混凝土施工过程中容易产生的蜂窝、麻面、孔洞、凹坑、线条不畅、施工缝夹层等混凝土表面缺陷,本文分别浅析了它们的成因及其相应的防治措施。