基于重新标度的中文短信文本聚类方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:wing001019
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
选择一组具有良好区分度的方向构建了CMAS坐标系,又根据初始簇的分布特性,构造出各个坐标轴的重新标度函数以提高聚类决策的有效性。其算法CMAS以迭代的方式收敛得到了最终解。CMAS算法的时间复杂度与K-Means保持在同一量级上。实验结果表明,CMAS算法有较好的聚类质量。
其他文献
针对入侵检测系统收集数据海量、高维、检测模型复杂和检测准确率低等问题,采用粗糙集属性约简的优势寻找与判断入侵与否相关的属性,利用决策树分类算法生成模型并对网络连接进
党的十六大以来,以胡锦涛为总书记的党中央创造性地推进马克思主义中国化的理论与实践,形成了以科学发展观为核心内容的一系列重大创新理论,初步形成了比较完整的科学理论体系。
期刊
人脸嵌入在高维观测空间中的低维流形上,为了更精确地描述人脸空间的细微结构,提出了一种基于局部测地距离的张量边界Fisher分析的人脸识别方法。采用二维张量表示人脸空间中的样本图像和局部测地距离来计算样本近邻点。该方法更好地揭示了流形内在的几何结构,能够更精确地选择位于流形上数据点的同类和异类近邻点,同时避免小样本问题。在PIE和FERET人脸数据库上的实验表明,用该方法能够获得更高的识别率,验证了