基于平均词频的文本特征提取方法

来源 :计算机应用与软件 | 被引量 : 15次 | 上传用户:wly9007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类中特征提取对分类效果有较大的影响,传统的特征提取方法在特征分布信息的量化方面存在不足。为此,提出一种基于特征词类内、类外平均词频的特征提取算法。算法通过特征词的平均词频类间集中度和文档频类间集中度来计算特征词的权重,能够更准确地反映特征词的分布情况。通过实验结果比较,可以证明,该算法有效地提高了分类效果。
其他文献
探讨急性一氧化碳中毒迟发性脑病的影响因素及其防治,对40例病人进行临床观察治疗回顾性分析.
目的:在腹腔镜胆囊切除术后使用穴位注射及中药热奄包治疗,探讨对患者术后第一次肛门排气时间及术后并发症(腹胀、恶心呕吐)的影响。方法:将我科76例腹腔镜胆囊切除术患者随机分为
目的:分析温肾健脾法治疗脾肾阳虚型糖尿病患者的疗效。方法:选取2014年我院收治的100例脾肾阳虚型糖尿病患者作为研究对象,将其随机分为对照组和观察组,每组各50例。对照组患者