论文部分内容阅读
本文探讨基于词频阈值、基于共现强度阈值这两种选词策略之间的联系,以及综合两种策略的选词方案对共词分析效果的具体影响。结果表明:如果采用词频阈值、共现频次阈值两种方法选取相同数量的关键词,那么两个关键词集合的元素重合率与选词的共现频次阈值呈二次多项式分布;分别基于这两种选词策略获取相同数量的关键词,将其合并之后得到的关键词集合具有更好的共词分析效果。