覆盖算法下文本分类特征选择的研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:gn8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类是信息检索和数据挖掘的基础,被广泛应用于网络数据挖掘及搜索引擎等方面。首先对文本进行分词,对分词的结果分别使用x^2。统计量(CHI)方法与相关系数法(CC法)进行降维,并使用维数调节的思想进行特征提取。在得到特征集后,使用覆盖算法作为文本分类器进行学习。实验结果表明,通过结合相关系数法、覆盖算法以及维数调节方法,可实现一个效果较好的文本分类器。
其他文献
通过Matlab在同步发电机短路分析中的仿真应用,将Matlab中的SimPowerSystems模块引入到电力系统的分析研究中,使大家对电力系统抽象的理论有一个生动、形象的认识,从而增强分
农田塑料薄膜(地膜)污染对土壤环境危害很大,覆膜灌溉技术可能会增加其复杂性。本文以新疆为例,依据材料力学试验结果,分析了覆膜灌水技术增加田间地膜回收难度的原因,得出:覆在地膜
中国大陆的伎乐、舞乐、散乐在奈良、平安初期陆续传到日本.12世纪末的镰仓时代之后,演剧活动普遍和宗教活动结合起来,带有一定情节的歌舞剧--"猿乐能"广为流传.在民间,农民
目的探讨磁敏感序列—增强T2^*加权血管成像(enhanced T2 star weighted angiography,ESWAN)序列多定量参数预测子宫内膜癌(endometrial carcinoma,EC)微卫星不稳定(microsat
针对移动通讯的便利性,利用J2ME开发移动图书服务终端应用程序,构筑智能客户端。通过PushRegistry注册机制动态注册引入的网络连接及定时提醒实现移动图书“随时、随地、随身”
患者男,19岁。发现右上肢肿物4个月,肿物持续增大1个月。查体:右上臂远端可见约5 cm×8 cm肿物,无压痛,质硬,活动度差,皮肤可见暗纹,皮温正常,皮色可。实验室检查:外周血
体视全息术是一种准三维显示技术,较之传统全息图,体视全息图大大降低了记录物体三维信息的数据量,使得计算机生成体视全息图成为可能,而空间光调制器SLM的不断发展也推动了全息
随着心肌梗死(myocardial infarction,MI)相关研究证据的更新,许多基于心血管磁共振(cardiovascular magnetic resonance,CMR)形态学、功能学及组织学的参数与MI硬终点事件密