【摘 要】
:
决策树是一类经典的机器学习方法,作为随机森林或Boosting等集成学习方法的基学习器,被成功应用于模式识别、数据挖掘、生物信息学等诸多领域。如何进行分割准则的设计以及分割的搜索是决策树学习的关键性问题,本文基于统计学习中优化目标函数展开研究,取得了以下创新性成果:提出了基于排序损失优化的新型分割准则:成对增益PG(Pairwise Gain)。传统决策树的分割准则主要是基于信息论或统计学等独立进行研究,本文提出了基于损失函数的分析框架,将各种经典的分割准则与不同的损失函数关联起来,从而给出分析分割准则的
论文部分内容阅读
决策树是一类经典的机器学习方法,作为随机森林或Boosting等集成学习方法的基学习器,被成功应用于模式识别、数据挖掘、生物信息学等诸多领域。如何进行分割准则的设计以及分割的搜索是决策树学习的关键性问题,本文基于统计学习中优化目标函数展开研究,取得了以下创新性成果:提出了基于排序损失优化的新型分割准则:成对增益PG(Pairwise Gain)。传统决策树的分割准则主要是基于信息论或统计学等独立进行研究,本文提出了基于损失函数的分析框架,将各种经典的分割准则与不同的损失函数关联起来,从而给出分析分割准则的统一框架。在此框架下,本文基于优化排序损失的解耦合下界提出了新型分割准则:成对增益,并通过理论和实验验证了成对增益对于随机标签噪声具有鲁棒性。提出了基于连续优化搜索分割的带权斜决策树WODT(Weighted Oblique Decision Tree)。传统决策树基于分割准则、并基于启发式暴力搜索分割构建决策树分支。本文通过随机初始化和连续优化目标函数进行分割搜索,在此基础上提出了一种基于权重的斜决策树WODT。实验结果表明WODT比之前的决策树具有更好的预测准确率,且树结构紧凑的同时,比当前斜决策树学习方法具有更快的训练速度。
其他文献
在力矩平衡和导弹无滚转运动假设的基础上,考虑导弹的推力矢量控制力和过载响应特性,采用四元数描述导弹速度方向,建立了包含导弹姿态信息的三自由度弹道仿真模型。仿真结果表明
为了研究增材在焊缝中的分布规律,在纯铝板上进行激光填粉焊接试验。焊接时通过预置粉末向,焊缝中加入硅粉、铜粉,采用电子探针分析焊缝横截面微区硅、铜的含量。实验结果表明,在
按照哈贝马斯的商议民主理论,商议民主包含了两个核心的要素,一是制度化的商谈机制,一是非制度化的公共领域中的商谈。制度化的商谈机制必须按照一定的程序来保证所有的利益
实现组织支持需要协调各分布式决策单元,并能有效整合局部模式。提出一种包括交互系统、协调器、问题处理系统、知识获取系统、知识系统的决策支持系统框架,并给出该框架的功
文中结合沪深300股票指数及沪深300股指期货数据实例分析了期现套利和跨期套利的可行性,但就现阶段而言期现套利还有很多制约因素,跨期套利没有考虑交易成本的冲击,需要进一
随着“互联网+”渗透到日常生活的各个领域,掌握国家经济命脉的央企在充分享受信息技术这把“达摩克利斯之剑”带来的红利同时,也面临数据泄露风险,特别是利用云计算、大数据
当前,网络舆论的强势地位正在显现,其影响力也在与日俱增,并产生了积极的和消极的社会影响。本文认为,网络舆论的形成路径包括:形成网络议题;形成舆论场;形成意见轴心;形成立
互联网信息技术的发展使微课教学成为热点,本研究以《综合英语》课程为例,对某高校英语教育专业学生采用微课教学和传统课堂教学进行分组实验,通过实验数据分析本论文得出结
首先介绍了三网融合的起源、发展与现状,讨论了互联网时代的媒体发展,认为媒体融合是媒体演进的历史必然,媒体融合也是在互联网时代占领文化制高点的必由之路,分析了三网融合
绩效管理通过设定科学合理的组织目标、部门目标和个人目标,为企业员工指明了努力方向。管理者通过绩效辅导与沟通及时发现下属工作中存在的问题,给下属提供必要的工作指导和资