【摘 要】
:
从大量的数据中提取和挖掘未知的、有效的和可操作的知识就是数据挖掘,它是知识发现过程中的重要步骤。数据挖掘能够发现未知的知识,区别于那些先提出假设再进行验证的数据处理
论文部分内容阅读
从大量的数据中提取和挖掘未知的、有效的和可操作的知识就是数据挖掘,它是知识发现过程中的重要步骤。数据挖掘能够发现未知的知识,区别于那些先提出假设再进行验证的数据处理方法。挖掘结果的有效性是指数据挖掘的结果是正确、合理的;挖掘结果的可操作性是指挖掘的知识能够为决策提供支持。数据挖掘越来越多地受到各界的重视并被广泛应用于各个领域。分类技术是数据挖掘中最有应用价值的技术之一。数据分类就是在大量数据中找出一组对象的共同特征,并将数据按照分类模型划分成不同的类的过程。该模型能够把数据库中的元组映射到给定类别集中的某一个。数据分类一般分两步,建立数据模型与使用模型进行分类。在使用模型进行分类前应首先评估该模型即分类器的预测准确率;如果准确率可以接受,就可以使用类标号对未知的数据元组或对象进行分类。人工神经网络是在现代神经生物学研究成果的基础上发展起来的一种模拟人脑信息处理机制的网络系统,它不但具有处理数值数据的一般计算能力,而且还具有处理知识的思维、学习、记忆能力。基于神经网络的数据挖掘过程由数据准备、规则提取和规则评估三个阶段组成。本文研究了教学型和分解型规则抽取算法,在分析了RX分解型算法后,利用关联法对输入输出神经元进行关联计算,按关联度排完序之后,用RBF神经网络进行结点选择,这样可以大大减少神经网络的输入结点个数,简化网络结构,减少子网的递归分裂次数,提高计算效率。最后,通过两个UCI数据集中数据的验证,表明了该方法的有效性。由于目前还没有任何一种分类方法对所有的分类问题都优于其他方法,因此对于各种分类方法的改进与优化是一个非常有意义的研究方向。
其他文献
随着电子政务建设的深入,政务门户网站建设的增多,其所承载的信息资源数量越来越大,门户网站也摆脱不了信息孤岛的宿命,传统的政府门户网站的建设模式也面临着一定的危机和挑战。
即时通信实时、多样化的服务特点使它逐渐替代电子邮件的地位,成为互联网用户日常交流的一种重要手段。在开放的互联网上传递消息,安全性是一个不可回避的问题,对用户之间发
决策支持系统(Decision Support System,DSS)是企业经营决策和提高企业核心竞争力的重要工具,它通过为企业提供各种决策信息及解决方案来提高决策的质量和效率。Agent技术是
肝脏分割是肿瘤切除手术、活体肝移植和微创手术等计算机辅助手术的基础。但是在肝脏和胃、心脏、肋骨的肋下脂肪等相邻组织的边界,相邻的器官通常和肝脏自身的密度非常相似。
医学图像配准是现代医学图像处理技术的一个重要方面,为医生充分利用多种模态的医学图像信息,提高医学诊断和治疗的准确性打下了基础。它不仅可以用于诊断治疗,还可以用于病
随着网络技术和Internet的迅速发展,基于B/S结构的服务端应用程序得到了广泛的应用。而J2EE平台的成熟以及各种开源框架的发展,为Web应用程序更进一步的发展提供了更广阔的空间
在多Agent系统中,由于环境是动态变化的,其他Agent的行为是未知的,所以多Agent系统及系统中的每个Agent应当具备学习或自适应能力。强化学习作为一种不需要环境模型的机器学
在现有的铝电解生产过程中,通过控制系统采集了大量的电解槽生产数据,这些数据反映了电解槽在采样时刻的各种工作状态,并在上位机监控系统中通过图形、报表等各种形式为用户
用户在云计算环境下租用IaaS层云服务执行工作流时,通常认为IaaS云提供的虚拟机上具备了执行所有任务的环境。由于工作流中任务的多样性和复杂性,不同任务需要的执行环境往往不
激励学习因具有较强的在线自适应性和对复杂系统的自学习能力,备受机器人导航研究者的关注。但其在连续状态和动作空间的泛化,局部环境的反应式控制,大状态空间和部分可观测