基于文本挖掘的聚类算法研究

来源 :微计算机信息 | 被引量 : 0次 | 上传用户：hy85323

【摘要】

：

随着网络中数据信息的大量积累,如何从海量文本数据中有效提取所需要的信息成为当前文本挖掘的重要内容。本文主要研究K-means和K-medoids两种聚类算法在文本挖掘中的应用,并

【作者】

：

徐东亮董开坤李斌王研芬

【机构】

：

哈尔滨工业大学（威海）网络与信息安全技术研究中心

【出处】

：

微计算机信息

【发表日期】

：

2011年02期

【关键词】

：

文本挖掘 K-means K-medoids 准确率召回率

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着网络中数据信息的大量积累,如何从海量文本数据中有效提取所需要的信息成为当前文本挖掘的重要内容。本文主要研究K-means和K-medoids两种聚类算法在文本挖掘中的应用,并通过实验利用基于人工判定的指标对两类算法在聚类文档的准确率和召回率方面进行了性能比较。实验结果表明,与K-means算法相比,K-medoids算法无论在准确率还是召回率方面都要高出5个百分点以上,且后者在处理异常数据和噪声数据方面更为鲁棒。

其他文献

综合护理干预对蛛网膜下腔出血患者并发症的影响

目的:探讨综合护理干预对蛛网膜下腔出血患者并发症的影响。方法:将120例蛛网膜下腔出血患者随机分为观察组和对照组各60例,对照组给予常规护理,观察组在此基础上给予综合护

期刊

护理干预蛛网膜下腔出血并发症

加强农业银行网点建设与管理

<正> 随着国有专业向商业银行转轨,农业银行在网点建设上暴露出的问题已越来越明显。这些问题主要表现在"四多四少",即农村网点多,城区网点少;效益差的网点多,效益好的网点少

期刊

银行网点区域设置建设与管理

农业部渔业渔政管理局主要职责和内设机构介绍

<正>根据《农业部办公厅关于印发渔业渔政管理局主要职责内设机构和人员编制规定的通知》(农办人〔2014〕47号)。现将渔业渔政管理局主要职责和内设机构情况介绍如下:一、主

期刊

渔政管理水产养殖内设机构农业部主要职责

格构护坡在城市道路中的应用

依据边坡以滑动破坏为主,间有局部崩塌,具有塌滑的破坏特征,结合边坡的地形地貌条件,设计采用坡底挡墙,坡面采用现浇钢筋混凝土格构加预应力锚索的永久性加固防护措施。

期刊

格构护坡预应力锚索坡底挡墙

中医推拿联合体外冲击波在肩关节周围炎患者中的应用

目的:探讨中医推拿联合体外冲击波治疗肩关节周围炎的效果,总结护理经验。方法:将168例肩关节周围炎患者按照就诊先后顺序,采用单双号分为观察组与对照组各84例,对照组进行体

期刊

中医推拿体外冲击波肩关节周围炎疗效护理

直译法的必备条件

期刊

直译法深层结构原文内容直译和意译

浅析互联网技术在城市规划中的应用

众所周知,随着性能技术日益发达,网络已经基本实现全覆盖和大众化的普及。21世纪是信息化的时代,互联网技术逐渐体系化并趋于成熟。越来越多的人们开始认识到了它的巨大作用

期刊

互联网技术概念城市规划应用

铁路路基下穿高速公路桥梁时对其影响的计算解析

以东北东部铁路通道下穿丹锡高速大孤山2号大桥为例,采用有限元分析软件进行模拟,计算铁路路基在荷载作用下对高速公路桩基沉降和承载力影响,并对高速公路桥梁进行结构验算,

期刊

桩基沉降有限元荷载作用沉降和承载力结构验算

流水句的理解与英译

期刊

流水句汉语句子

国外钻井取心新技术(二)

介绍了贝克休斯公司的 7种钻井取心工具 ,包括马达取心工具、复杂地层取心工具、2 50P系列取心工具、Coremaster取心工具、HT系列取心工具、液压全封闭取心工具和长距离可调

期刊

取心工具取心钻头结构特点性能

基于文本挖掘的聚类算法研究

其他学术论文