论文部分内容阅读
市场竞争日趋激烈,商家需要充分了解自己的顾客,很多商家应用关联规则挖掘来分析顾客的购买行为。目前,如何提高关联规则的挖掘效率仍然是研究的重点。本文提出了一种基于品类聚类的关联规则优化算法。该算法首先根据文中定义的品类特征向量,用结构化的数据来表示事务:然后根据一种基于密度的聚类算法,对结构化的数据进行聚类,同时将对应的原始事务进行聚类:最后根据聚类后得到的类的长度以及用户指定的最小支持度,确定类内的最小支持度,在类内挖掘关联规则。实验结果表明,与传统算法相比,该算法效率较高,具有一定的实用价值。本文的应用背景是货物进出口检验检疫系统,在检验检疫过程中,物品名称都是由几个词语构成,如果能找出某几个单词与某一个编码之间的关系,将对物品的自动编码提供很大的帮助。本文提出了一种方案,基于物品名称的品类信息,结合上海浦东国际机场检验检疫局HS商品编码辅助决策系统的需求,将基于品类聚类的关联规则算法,应用到上述系统当中,有效地找出了某几个单词之间的关联规则,利用这些关联规则优化规则库,实现了待检验商品的智能化编码。