聚类分析在水务欺诈甄别中的应用研究

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:gaolch013
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国城市化建设进程的加快,对城市水资源的供给需求也越来越大。在增强供给能力的同时也需要考虑减少不必要的损耗。供水损失率大一直是困扰供水行业的一大难题,其中各种各样的违法用水是造成供水损失的主要原因。在传统调查窃水用户方法有效性日益降低的今天,水务行业迫切需要一种新的技术来解决水损问题。   数据挖掘是一种能够发现数据间联系和规则的数据分析技术,在诸多领域都有应用。它的出现给水务行业的欺诈甄别提供了一些新的方法。   针对水务行业数据先验知识较少,数据量大的特点,采用聚类分析作为水务行业欺诈甄别的方法。聚类技术适用性广泛,不需要先验性知识。它能把具有相同行为的用水用户聚集到一起,这种聚合方式有助于分析人员找到用户的用水模式,给判定不良用水行为提供有力依据。   本文原型系统数据来自鞍山市自来水公司收费系统,采用凝聚的层次聚类算法进行分析,使用树形图来描述聚类结果。本文还提出了一种改进的类别划分函数作为聚类结果的类别划分依据。该方法较好地描述了类间紧密度和分离度的关系,在欺诈甄别分析的过程中与层次聚类算法结合,经过测试并与真实情况进行对比,取得了比较满意的结果。
其他文献
随着网络技术的发展,各种新的业务相继出现。这些业务在带宽和延迟等方面有着不同的要求。如何支持这些业务的QoS要求,是当前网络研究的一个热点。流量整形和分组调度都是实
对遗传算法的研究有很多方面,一批学者在对遗传算法的基本构成-选择、交叉和变异等三个基本遗传算子和群体大小、终止代数及其相应算子概率等运行参数的研究后发现,算子及其
语音识别技术日趋成熟,但仍然存在一系列难题有待解决,尤其是大词表连续语音识别(LVCSR)技术,在识别速度、识别正确率、系统顽健性等能力上还远远没有达到尽善尽美。特别是在
动态网络最短路径问题是网络优化的重要内容,传统的求解算法如Dijkstra算法、A*算法无法求解动态网络最短路径问题,而智能算法如遗传算法等迭代次数高、效率低下,为了更好的
通过分析当前国内外动漫产业的发展情况,发现动漫产业在国际市场上是备受关注的,并且是当今时代市场前景最广阔的产业之一。如何在新一轮的知识经济浪潮中,发展有中国特色的
网格是当前高性能计算方面研究的一个热点问题,被称为下一代计算机网络的基础。网格的目的是利用互联网把分散在不同地理位置的电脑组织成一台虚拟的超级计算机,实现计算资源
随着全球网络信息化的飞速发展,保障电子商务和电子政务系统安全的PKI/CA系统的数量也在不断增加,随之产生了许多相互独立的PKI/CA系统孤岛。从属于不同CA的用户为了验证相互之
带性能约束复杂布局问题,如印刷电路板(PCB)和航天器舱的布局方案设计及工厂机床设备布置问题等,属于NP-Complete问题,求解困难。在求解这些问题时,除了要求满足待布物间不干
表格处理软件是报表软件系统的不可缺少的重要组成部分,它控制各种格式报表的产生、展示与输出。表格处理软件的研究开发对于提高报表设计过程的可视性、易用性,提高报表设计
近年来无线传感器网络基于其深远价值与意义,一直被热门关注和研究。由于传感器节点之间通信能量开销占节点能量总开销的比重大,以及用户特殊查询目的等因素,用户有时想执行