论文部分内容阅读
随着信息化程度的不断加强和互联网技术的不断发展,数据集成技术得到了前所未有的发展。用户在获得丰富的集成数据资源的同时,也需要面对如何断定集成数据资源的准确性及其来源等世系问题。在实际的养老审计过程中,也存在这样的问题,即当审计人员在集成的审计数据上进行审计时,如何对审计中发现的疑点数据的准确性进行核实,目前是通过人工手段进行分析,效率和准确性都很低。通过对数据世系理论的研究,本文提出了一种建立模型映射关系和设计RDSA算法的方法,来自动解决疑点数据准确性核实的问题。第一个阶段是在养老审计的原始模型与标准模型之间建立映射关系,主要分为表级映射关系的建立和数据属性字段级映射关系的建立两个过程。表级映射关系的建立分为三步,首先,用产生式表示法将养老审计经验进行形式化处理,从而构建审计经验知识库;然后,基于知识库,实现表规则提炼算法,提炼出每个表的规则集合;最后,本文通过表的规则集合,在两个模型中建立了表级之间映射关系。属性字段级的映射关系建立是在SMDD方法的基础上,通过构建属性字段的两类分布模型向量和相应的归类算法来实现的。第二个阶段是设计RDSA算法。在对审计方法分析的基础上,提出了逆向模式映射和连通图相结合的策略及相应的算法。在养老审计系统中,实现了由标准模型上的审计方法可以自动生成原始模型上的审计方法,从而解决了养老审计中疑点数据的世系追踪及核实问题。最后,本文以实际的养老审计数据模型为基础,对研究中所构造的算法进行了实验验证。同时,本文对疑点数据进行了世系追踪,找到了原始数据,实现了疑点数据的核实。