论文部分内容阅读
随着信息技术的不断发展,传统的对社会保障的人工审计已经不能满足现阶段的审计需求,因此,利用计算机进行审计工作成为了一种有效的方法。在利用计算机进行社保审计时,第一步需要进行的工作就是数据的准备工作。由于被审计单位通常不能按照审计数据标准提供数据,这样便需要进行数据采集工作。因此,研究基于审计数据标准的信息匹配技术,来辅助审计人员快速的完成数据映射,具有非常重要的意义。以往都是审计人员根据以往的审计知识,同时结合当地的社保业务,人工来进行异构数据与审计数据标准的对应关系。这样虽然能够比较准确的完成数据采集工作,但是其时间复杂度也很高,不利于审计工作高效的进行。本文提出了一种基于审计数据标准的信息匹配方法。该方法主要由表匹配和字段匹配两部分构成。表匹配过程主要通过融合一阶逻辑和语义相似度的方法来完成匹配,主要包括:基于一阶逻辑的表匹配方法、基于语义相似度的表匹配方法和表匹配结果合并;字段匹配方法主要通过对字段进行标准化处理之后,使用构建的基于审计数据标准的分类模式进行分类,然后使用生成反馈算法进行匹配,最后通过融合语义相似度的方法来完成匹配选择过程,主要包括:社保数据的预处理、基于审计数据标准的分类模型的构建、生成反馈算法和融合语义相似度的匹配选择。最后,本文对文中所研究的算法分别进行了实验的验证,并对实验的结果进行了对比分析,验证了本文方法的有效性。