基于K-means聚类电力大数据审计证据发现研究

来源 :现代科学仪器 | 被引量 : 0次 | 上传用户:Zero1_41004513
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究通过K-means聚类算法进行电力大数据审计证据发现的技术过程,以寻找一种普适性的电力大数据审计证据发现模式,改变以往就特定问题开发相应系统的被动状态。采集电网的运行、调度、营销数据,使用回归法、差分法、导数法等进行数据治理,增加数据的丰度,进而使用K-means聚类算法为核心算法的迭代分析法寻找数据中的特征数据点,进而发现相应问题的数据审计证据。经过测试,在较大数据集迭代30次的离线数据分析基础上,对数据的分析敏感度超过85%,在较小数据集迭代70次的在线数据分析基础上,对数据的分析敏感度超过91%
其他文献
摘 要:针对传统测控领域存在的测试效率低、测试复杂度高、测试资源利用不足等问题,文章提出基于B/S架构的分布式测控技术架构,利用SOA(面向服务架构)设计思想,并结合实时中间件和分布式数据库实现设备间的互联互通互操作,提高测试效率,降低测试复杂度,在分布式架构下,充分利用测试资源。该文对当前从事测控领域的设计人员和开发人员具有一定的参考价值,是面向服务架构设计思想的综合应用体现。  关键词:B/S
摘 要:文章设计了一种基于自然语言处理的发电设备知识库系统,包括知识抽取、语料和知识存储、知识问答排序和知识库前端问答等模块,构建过程为:首先进行发电设备领域自然语言处理基础模型训练,再针对领域语料进行知识抽取,最后利用排序模型实现知识问答。对比4种知识抽取方案可得:对于Top1和Top3准确率,知识抽取前处理增加MRC模型比后处理增加MRC校验回路准确率高;对于Top5准确率,后处理中增加MRC
摘 要:文章对融合词信息增强中文命名实体识别问题进行了研究,提出一种用于中文命名实体识别的融合词信息神经网络模型系统。首先使用预训练语言模型Bert对字进行编码得到字标识,然后使用SoftLexicon基于统计的方法将词统计语义信息融合进入字表示中,之后使用设计的GraphLexicon根据文本内字、词之间的交互关系图结构,将字词信息表示相互融合,达到较高的命名实体识别准确率。  关键字:中文命名
摘 要:随着知识图谱技术及应用的不断发展,形成了一系列独立的开发组件库,这些组件库在知识图谱的某些环节和领域中具有广泛的应用,但是其中大多数组件库之间相互独立、缺少统一标准,难以聚合形成体系开放能力。由于需要掌握多个独立组件的开发规范标准,这给相关研究和应用造成一定的难度和阻碍,因此利用Python的集成设计模式和语言黏合优势,对成熟的组件库进行分层分类整合,具有重要的实用价值。  关键词:知识图
摘 要:在基于通信的列车运行控制CBTC系统中,列车自动监控子系统用以在线指挥和监督列车的运行,其对提高列车的运行效率至关重要。应用服务器是ATS子系统的大脑,可保证ATS系统的稳定运行,因此其可用性和可靠性尤为重要。通过引入集群,可大幅提高应用服务器的可用性和可靠性,截至目前,应用服务器集群已在长沙地铁四号线安全运营两年。  关键词:列车自动监控;应用服务器;集群  中图分类号:TP315;U2
摘 要:通信原理的概念抽象难懂且数学计算复杂,教学过程中普遍采用商业工具进行原理仿真。为了实现低成本、便于操作的通信原理仿真,提出了采用普通的电子表格直接建模仿真通信原理的方法。先分层实现通信系统中各个模块的功能,再组合一起模拟通信仿真。仿真过程中可直接在电子表格的单元格中查看所有数据(也可以通过图表展示),提高了学习者分析问题、解决问题的能力。  关键词:通信原理;电子表格;仿真教学;单元格  
摘 要:雷达杂波消除模块能最大限度降低杂波干扰,充分发挥雷达的工作性能。移动目标显示模块和恒虚警模块是雷达信号处理的两个主要模块。移动目标显示模块能成功分离雷达回波信号和干扰信号。分离出的回波信号有大量的残余信号,为了消除残余信号,必须对雷达信号进行恒虚警处理。借助FPGA开发工具,采用模型化方法设计雷达杂波消除模块,可以最大限度缩短设计周期、降低开发费用、节省硬件资源。  关键词:干扰信号;移动
摘 要:近年来,室内定位的需求日益增加,实现室内精确定位成为了学者追求的目标。多个Wi-Fi源发出的信号叠加在某位置点时,会呈现出诸如指纹般的唯一识别特性,這种特性使得使用Wi-Fi指纹对特定对象进行室内定位成为可能。文章首先研究了Wi-Fi指纹信号序列的最佳组成形式,选用适当的筛选算法对指纹信号数据进行筛选。将结果数据的不等长序列归一化成等长序列录入数据库。然后和位置索引库中的数据进行比对,从而