多关系数据挖掘技术研究及在纳税评估中的实现

来源 :山东轻工业学院 齐鲁工业大学 | 被引量 : 0次 | 上传用户:hanjiezm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘(Data Mining, DM)就是从大量数据中发现潜在规律、提取有用知识的方法和技术。近年来,数据挖掘受到了国内外的普遍关注,己经成为信息系统和计算机科学领域研究中最活跃的前沿领域。由于传统的数据挖掘技术是基于单一关系基础之上的,不能完全满足现实中数据复杂情况下的应用,本文提出了多关系数据挖掘技术。当前,纳税评估已经成为我国税收管理工作的一个重要组成部分。随着计算机技术及网络的应用,我国税务系统在信息化建设中,相继实现了省级以上的数据集中模式,初步形成了多个应用系统共享一个网络的格局。这些系统的运行又产生了大量业务数据,如何将这些数据进行整合、分析和挖掘,以支持目前和今后税收的科学管理与决策,成为目前税务信息化的重要工作。采用传统的技术手段建立的纳税评估信息系统存在诸多问题,而使用多关系数据挖掘的方法能有效的解决这些问题。本文通过研究多关系数据挖掘的过程模型和方法模型,分析目前纳税评估系统的应用及现状,以纳税评估系统中评估指标能由计算机系统自动建立和维护从而使得评估对象的产生具有一定的科学性和公证性为目标,选择了适用的多关系数据挖掘方法一一分类方法。在研究了分类方法的多种算法后,结合税务数据和纳税指标的实际,确定了运用多关系决策树算法中的快速可伸缩(Supervised Learning In Quest)算法,但由于该算法无法直接利用数据库管理系统(Database–Management System, DBMS)中的数据,并且构建决策树过程中计算量过大,进而选择并使用了其改进算法QLIQ算法来进行实现。最后,根据数据挖掘的过程模型,借助于当前广泛使用的大型关系数据库系统——SQL Server所提供的Analysis Manager,设计了基于QLIQ算法的纳税评估对象筛选系统,实现了纳税评估指标的自动建立和维护以及评估对象产生的科学性和公正性。实验表明,该算法能有效地解决以往纳税评估系统中存在的诸如指标选择难并且需要手工设置以及评估对象的产生缺乏科学依据等问题,满足业务需要,而且高效、易于实现。随后在论文的末尾又简要介绍了纳税评估完成后对结果进行反馈的子系统。
其他文献
混合蛙跳算法是一种仿生物学群体智能优化算法,被成功用于求解实际优化问题。但是,因为其提出的时间相对较短,所以目前的研究还没有达到成熟和全面。目前,大多数文献在其算法分析
以往,《Visual Foxpro6.0))的考试形式主要还是采取传统的笔试形式,来测试学生对基本知识掌握的情况,不能对学生的实际操作能力进行有效评价。因此,对学生应用《Visual Foxpro6.0》
学位
网格计算是继Internet和Web之后最重要的信息技术,并且也是随着Internet技术迅速发展起来的。集群(Cluster)、P2P(Peer-to-Peer)和网格是下一代并行和分布式计算的一种流行模
随着计算机的普及和网络技术的发展,人们面对的信息量巨大(海量信息),并且信息结构和关系复杂,完全超出了人们所理解的范围;并且,在一般的信息系统(或数据库)中,对象的属性值
对SHA家族哈希函数的研究是当今对称密码学研究的一个重要分支。近年来对Hash函数的差分攻击主要围绕王小云等人提出的方法,即构造局部碰撞和多区块碰撞、消息修改技术及差分
随着信息系统的广泛应用,公司、企业和政府逐渐将其业务扩展到信息平台上来,由此导致应用系统的规模不断增大,参与业务功能的计算机节点不断增多,业务应用的覆盖范围也不断扩
医学图像的分割和特征提取是医学图像处理中的关键技术,它们是医学图像识别的前提并为计算机辅助诊断提供了重要的信息。特征提取是标识图像的关键一步,如何准确、充分的提取
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,数据库不仅在数量上快速增长,规模也越来越大。激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分
随着人们对信息安全的日益关注,作为保证数据安全的关键技术,密码学也得到了极大的发展。密码学应用已经渗透到社会各个领域,其中安全多方计算作为密码学的一个重要研究方向,为保
随着通信与计算机技术的迅速发展,越来越多的关键数据被存储在计算机系统中,这些数据的丢失或损坏将对企业造成难以估量的损失,因此计算机系统的高可用性具有格外重要意义。