论文部分内容阅读
数据挖掘技术是从大量的数据中发现以前未知的、隐藏的的信息,以便为人类活动作出指导。该技术知识最早应用于商业领域,且大部分是为了预测商业客户及产品销售。数据挖掘技术包括数据准备、数据挖掘及知识发现等几个不可或缺的步骤。在数据挖掘之前,必须先对所有的数据进处理行预处理,它包括数据清理、数据整合和数据还原。在数据整合阶段,从不同数据基点获得的不同的数据类型将被整合成一个单一类型的数据集。知识发现包括在很多数据间复制、转换的过程。数据挖掘技术发展至今,为了有效的挖掘数据仓库中的知识,已经发展出了多个不同的挖掘方法和算法。例如:特性描述、归纳、分类、聚类、关联、演变和模式匹配等。特性描述法一般用于总结一个数据集的一般性特点,而分类法主要用于将一个现有的训练集进行新的分类。决策树、回归分析、人工神经网络、支持向量机及k-近邻算法都是分类算法中应用较多的方法。聚类分析是从任一数据集中将相似的数据结果进行聚类的方法。聚类法中常见的方法有分层法、划分法、基于密度的方法等。关联规则分析法是从所处理的数据集中发现其中的关系。关联规则一般解决两个问题,即(1)在最小支持度阈值内发现频繁项目集及对应的支持度;(2)利用步骤(1)中发现的频繁项目集的置信度的基础上生成关联规则。因此,许多关联规则的算法都是以发现频繁项目集为核心发展起来的,最早且最经典的关联规则中使用的算法是Apriori算法。此后,为了提高生成频繁项目集的效率,许多在Apriori算法的基础上发展而来的改进算法和新的算法研究出来。新的关联规则算法中使用较广的有:(1)FP-growth算法,该法因只需扫描数据库两次但不生成候选项目集而提高了效率;(2)并行挖掘法,它的计算环境中存在多个处理器,挖掘任务被分成几个子任务后同时在不同的处理器中处理;(3)抽样算法,该法的不足之处在于有时生成的关联规则不是全部的,从而需要对数据集重新扫描。本论文以云南某多金属硫化矿选厂的生产数据为研究对象,利用数据挖掘技术,对工艺流程、药剂制度、选矿指标等进行了分析。研究发现:(1)原矿中铜矿物、铅矿物与锌矿物间共生关系密切,应进行详细的工艺矿物学研究;(2)铜浮选作业中添加的石灰、W-23、Y-541、硫酸锌、亚硫酸钠、硫化钠的用量均偏高,应进行适当的调整;(3)锌浮选作业中添加的石灰用量可进行微量的降低,以提高锌精矿回收率,而硫酸铜、Y-541用量合适;(4)铜浮选中添加的药剂对锌回收有重要影响;(5)铜浮选与锌浮选在药剂制度上存在矛盾,需要在铜回收率和锌回收率之间做出选择或者寻找保证铜、锌回收率在经济效益均较高合适的药剂用量。