领域驱动的人机交互式决策树模型及其算法研究

来源 :云南财经大学 | 被引量 : 0次 | 上传用户:ah12345679
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是数据库中知识发现的一个重要步骤,传统数据挖掘是以数据对象作为研究基础的挖掘方法,注重算法的运行效率以及模型的准确率,是一种面向数据或者称为数据驱动的数据挖掘,其挖掘结果包含大量的冗余规则、无需挖掘就可以得到的知识甚至是一些违反常识的错误结论,存在很大的弊端。决策树是数据挖掘分类技术中的主要模型。针对决策树算法没有考虑挖掘结果使用者的偏好、相对应领域的知识约束、挖掘结果的可操作性等问题,应用DDDM(Domain Driven Data Mining)的思想,提出一种在构建决策树过程和结果评价标准中,融入用户兴趣度以及领域知识的人机交互式决策树模型,客观地评价挖掘结果在实践中的具体效益,交付可直接用于实际行动的决策支持。领域驱动的人机交互式决策树模型强调用户在数据挖掘过程中的参与度与主动性,改变传统决策树仅仅利用预先设置的算法,由机器自动搜索训练集中的隐含模式这种被动的挖掘策略,使以模式输出为主的数据挖掘系统发展成为实际问题解决方案输出的决策系统。本文的主要研究内容包括以下几个方面:1.根据传统数据挖掘局限于以数据和算法为中心,忽略了真实环境下各种领域知识对于挖掘过程的约束,分析这种旧挖掘模式的不足之处与自身缺陷。从理论水平、方法框架、模式架构等几个方面,综述近十年来领域驱动数据挖掘的发展历程和国内外专家学者的研究成果。2.设计转化属性值的代价矩阵和类别的效益矩阵来体现数据挖掘用户的兴趣度和所挖掘领域的知识约束。定义决策分枝的概念及其价值,并用该价值作为领域驱动决策树算法的属性选择度量。3.以经典决策树算法为基本框架,提出一种领域驱动的人机交互式决策树构造算法和评估有效分枝转移的决策推荐算法,让数据挖掘结果使用者可以直接得知最佳方案的实际效益,做出正确、合理、可操作的决策。4.基于上述理论研究,用德国电信旗下的T-Systems宽带客户数据集进行实验验证。根据用户的兴趣度和具体的商业利润,设置不同转化属性值的代价矩阵和类别的效益矩阵对同一测试数据集进行挖掘,分析对比挖掘结果的实际商业利益。实验结果表明领域驱动的人机交互式决策树模型在没有降低分类准确率的情况下,所挖掘的决策规则易于理解、实践性强、商业价值高。
其他文献
语音识别是根据语音波形中反映说话人生理和行为特征的语音参数,自动识别出说话人的过程,是语音信号处理的一个重要研究方向。作为一种生物识别技术,它具有广泛的应用前景,得
2010年,全球的数据量跨入了ZB时代,根据IDC预测,至2020年全球将拥有超过35ZB的数据量,海量数据将直接或者间接的影响我们的日常工作、生活,乃至国家经济以及社会的发展[1]。
当前大部分搜索引擎都存在搜索结果有大量重复网页或者转载网页的问题,同时中文搜索引擎的网页聚类也处于刚刚起步阶段,很多技术都还不能应用到实际应用中去。随着中国高校的
当今的信息社会的中,人们每天都要处理各种各样的信息和数据。随着信息的爆炸式增长,许多应用中需要处理的数据规模也越来越大,这些数据以快速的、大量的、按时间顺序连续到
温室效应、能源危机等全球性问题是制约社会发展的重大问题。接入网的能耗在电信网络中占有较大比重,接入网节能技术已经成为下一代宽带接入网的重要研究方向。光纤无线宽带
随着互联网技术的迅猛发展,以及不断扩大的数据库规模,数据挖掘技术在中医学中的应用也变得越来越突出。中医学中一个重要的组成部分是方剂学,它是中医基础理论与临床的纽带
随着世界各国车辆数量的急剧增加,交通状况日益受到人们的重视。如何有效地进行交通管理,越来越成为世界各国政府和有关部门所关注的焦点。针对此问题,各种智能交通管理系统
物体的三维重建问题是虚拟现实和三维可视化领域的研究热点。论文主要研究物体三维数据点云的实现技术。以双目立体视觉的基本原理作为理论依据,构建由多台CMOS摄像机构成的
地震、火灾、矿难等灾难发生后,在废墟中搜寻幸存者给予必要的医疗救助,并尽快救出被困者是救员人员面临的紧迫任务。近年来为了满足救援工作的需要,国内外很多研究机构开展
视频监控是图像处理和计算机视觉领域的研究热点,近年来引起越来越多人的关注。视频图像中运动目标检测效果的好坏,会对图像分割、目标跟踪和行为理解等后期处理产生重要的影