覆盖算法下文本分类特征选择的研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户：gn8888

【摘要】

：

文本分类是信息检索和数据挖掘的基础，被广泛应用于网络数据挖掘及搜索引擎等方面。首先对文本进行分词，对分词的结果分别使用x^2。统计量（CHI）方法与相关系数法（CC法）进行降维，并使

【作者】

：

段震王倩倩张燕平张铃

【机构】

：

安徽大学计算智能与信号处理教育部重点实验室

【出处】

：

计算机技术与发展

【发表日期】

：

2008年11期

【关键词】

：

文本分类 x^2统计量覆盖算法特征选择 text classification x^2 statistic cover algorithm featu

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本分类是信息检索和数据挖掘的基础，被广泛应用于网络数据挖掘及搜索引擎等方面。首先对文本进行分词，对分词的结果分别使用x^2。统计量（CHI）方法与相关系数法（CC法）进行降维，并使用维数调节的思想进行特征提取。在得到特征集后，使用覆盖算法作为文本分类器进行学习。实验结果表明，通过结合相关系数法、覆盖算法以及维数调节方法，可实现一个效果较好的文本分类器。

其他文献

Matlab在同步发电机短路分析中的仿真应用

通过Matlab在同步发电机短路分析中的仿真应用,将Matlab中的SimPowerSystems模块引入到电力系统的分析研究中,使大家对电力系统抽象的理论有一个生动、形象的认识,从而增强分

期刊

同步发电机电力系统SimPowerSystems

覆膜灌水技术对农田地膜清除的影响

农田塑料薄膜（地膜）污染对土壤环境危害很大，覆膜灌溉技术可能会增加其复杂性。本文以新疆为例，依据材料力学试验结果，分析了覆膜灌水技术增加田间地膜回收难度的原因，得出：覆在地膜

期刊

农业环境节水灌溉技术土壤环境塑料薄膜agricultural environment water-saving irrigation soil en

“能乐”的精神性与日本人的美学趣味

中国大陆的伎乐、舞乐、散乐在奈良、平安初期陆续传到日本.12世纪末的镰仓时代之后,演剧活动普遍和宗教活动结合起来,带有一定情节的歌舞剧--"猿乐能"广为流传.在民间,农民

期刊

歌舞剧日本人“能乐”精神性美学趣味戏剧

磁敏感序列多定量参数预测子宫内膜癌微卫星不稳定状态

目的探讨磁敏感序列—增强T2^*加权血管成像(enhanced T2 star weighted angiography,ESWAN)序列多定量参数预测子宫内膜癌(endometrial carcinoma,EC)微卫星不稳定(microsat

期刊

子宫内膜肿瘤磁共振成像微卫星不稳定预测endometrial neoplasmsmagnetic resonance imagingmicrosat

基于PushRegistry移动图书通知的设计与实现

针对移动通讯的便利性，利用J2ME开发移动图书服务终端应用程序，构筑智能客户端。通过PushRegistry注册机制动态注册引入的网络连接及定时提醒实现移动图书“随时、随地、随身”

期刊

PushRegistry移动图书馆通知SynCMLPushRegistry mobile librarynotify SyncML

上肢木村病一例

患者男,19岁。发现右上肢肿物4个月,肿物持续增大1个月。查体:右上臂远端可见约5 cm×8 cm肿物,无压痛,质硬,活动度差,皮肤可见暗纹,皮温正常,皮色可。实验室检查:外周血

期刊

木村病磁共振成像上肢kimura diseasemagnetic resonance imagingupper extremity

基于DMD和分数傅里叶的动态全息体视图显示

体视全息术是一种准三维显示技术，较之传统全息图，体视全息图大大降低了记录物体三维信息的数据量，使得计算机生成体视全息图成为可能，而空间光调制器SLM的不断发展也推动了全息

期刊

体视全息术DMD全息显示系统分数傅里叶变换体视全息图holographic stereographyDMD holograph display sys

MR参数作为心肌梗死终点事件的基础与应用——心肌梗死研究中心血管MR终点选择专家共识解读

随着心肌梗死(myocardial infarction,MI)相关研究证据的更新,许多基于心血管磁共振(cardiovascular magnetic resonance,CMR)形态学、功能学及组织学的参数与MI硬终点事件密

期刊

心血管磁共振心肌梗死终点事件临床研究实验研究cardiac magnetic resonancemyocardial infarctionendp

覆盖算法下文本分类特征选择的研究

其他学术论文