论文部分内容阅读
我国水资源污染状况触目惊心,这加剧淡水资源短缺的同时也影响到人类的健康。有效优化污水处理过程,降低能源消耗成为迫切的需求。目前,污水处理厂的污水处理过程主要依赖知识的故障监测专家系统,而建立知识系统的关键是知识库的建立,这主要依赖于专家丰富的经验,因此存在一定的局限性:当运行过程中出现异常状态时,只有少数经验丰富的操作者才能有效的维护。为此,有人提出基于数据挖掘技术进行污水处理过程的异常检测,这样将提高污水处理厂的运行效率和管理水平。本论文利用聚类分析技术为理论基础,提出具有更高聚类效率和效果的Twi-CLARANS聚类算法,并且结合遗传算法优化,将优化算法运用于寻找污水处理厂监测数据中的异常数据,最终得出故障生成规则,促使工厂能尽早地采取正确的措施恢复正常。本文研究内容和成果如下:1.通过聚类算法中各个算法特性、适应范围以及核心思想的分析,选择基于划分法的CLARANS算法作为原型,对污水处理厂的异常数据进行聚类。2.基于传统CLARANS算法和网格思想,提出一种改进后的聚类算法:基于网格的二次CLARANS算法。相比传统CLARANS聚类在所有数据中随机选择初始节点的思想,改进后的算法从密集网格中挑选初始节点进行聚类,可以提高算法的执行时间,更关键的是能避免陷入局部最优;另外,将第一次得到的最优解放在原始数据中作为第二次CLARANS聚类的初始节点进行测试,这能降低孤立点被忽略的可能性,保证数据样本的完整性。在对大量数据进行仿真测试后,实验证明它能够实现高度聚集,同时提高其聚类效率。3.改进后的聚类算法Twi-CLARANS在聚类效率和质量上都有所提高,但是基于划分原理的算法是一种局部搜索机制,这使得它在实际应用时受到很大限制,所以需要结合具有全局搜索能力的遗传算法。本文将Twi-CLARANS算法和遗传优化相结合,弥补Twi-CLARANS算法的局限性。研究表明,将基于遗传优化的Twi-CLARANS算法运用于污水处理厂的监控数据中,能从样本数据中找出异常对象,并根据异常对象的属性归纳成故障规则,让污水处理厂能及时有效的针对故障采取对应的措施,提高工厂运行效率。