类内和类间距离分布函数的确定及应用

来源 :山西大学 | 被引量 : 1次 | 上传用户:zh9958
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
类内、类间距离分布函数的研究具有重要的现实意义,本文我们主要利用参数统计的方法来确定类内、类间距离的分布函数。基于类内、类间的分布函数,我们提出了基于类内距离参数估计的文本聚类评价方法,同时确定了基于类内、类间距离比值型(ratio)指标的临界值。首先,文章研究了基于类内距离参数估计的文本聚类评价方法,发现当聚类类别数过小或与真实类别数相同时,该方法是可行的;而且它可以减弱初始类中心的选取对K-means算法的影响,提高聚类结果的准确性。其次,本文对基于类内、类间距离的比值型(ratio)指标的临界值也进行了研究,我们通过实验确定了聚类指标真实值在上、下界范围区间的位置,该位置可以作为评判基于类内、类间距离的比值型(ratio)指标好坏的依据。
其他文献
晋商的衰落大体上始于1905年开始的慈禧“新政”,急剧衰落于辛亥革命成功之后,最终在20世纪30年代湮没于历史的长河中。曾经创造了“贸易天下”、“汇通天下”和“富甲天下”辉
根据锅炉水管的腐蚀特性,提出了B超在锅炉水管检验中的实用性和优越性,并取得了较好的经济效益.
本文对钢/铝/镁复合板的制备与组织性能进行了探讨。通过热轧方法制备钢/铝/镁复合板,通过金相显微镜、显微硬度计、拉伸试验机、扫描电子显微电镜、能谱仪等试验设备对制备
凭借接近2500万辆的乘用车年销量,我国已成为全球第一大汽车市场。截止到2017年,我国汽车的保有量已到达2.09亿辆。其中,2017年二手车的年交易量为1240万辆。相比其他成熟的