论文部分内容阅读
研究通过K-means聚类算法进行电力大数据审计证据发现的技术过程,以寻找一种普适性的电力大数据审计证据发现模式,改变以往就特定问题开发相应系统的被动状态。采集电网的运行、调度、营销数据,使用回归法、差分法、导数法等进行数据治理,增加数据的丰度,进而使用K-means聚类算法为核心算法的迭代分析法寻找数据中的特征数据点,进而发现相应问题的数据审计证据。经过测试,在较大数据集迭代30次的离线数据分析基础上,对数据的分析敏感度超过85%,在较小数据集迭代70次的在线数据分析基础上,对数据的分析敏感度超过91%