【摘 要】
:
信息化技术为现代人类的工作、生活、学习和娱乐等各个方面带来了更便捷和快速的问题解决方法,但同时由此产生的多元化异构数据也越来越多。如何有效利用机器学习方法,从这些
论文部分内容阅读
信息化技术为现代人类的工作、生活、学习和娱乐等各个方面带来了更便捷和快速的问题解决方法,但同时由此产生的多元化异构数据也越来越多。如何有效利用机器学习方法,从这些复杂数据中挖掘出有用信息,并应用到实际生活中,对现代从事机器学习和数据挖掘研究的人来说,既是机遇,也是挑战。集成学习是机器学习与数据挖掘领域的重要研究分支之一,其优势在于能够把多个独立的单一分类学习器有机地结合起来,从而获得一个更准确、稳定和强壮的集成学习模型。传统的分类器集成方法在处理数据时,往往是通过选择部分特征或样本训练单一分类器来提高模型各分支间的多样性,以提高集成模型的泛化能力。但这些方法存在一定的局限性:1、选择部分特征或样本意味着在训练单一分类器时另一部分特征或样本要被舍弃,容易造成单个分支的信息丢失,导致基分类器精度下降;2、这些方法很少考虑通过去除集成模型中的冗余和无效分类器来提升集成模型的性能。为了解决上述局限性1,本文提出了一种新的混合降维集成学习方法(HDRF)来提高集成系统中各分支之间的多样性,但同时为每个分支保留了更多的训练样本信息。首先,采用基于树的特征选择算法对有效特征进行分割,并用Bagging方法得到不同的训练子集。然后针对未被选择的样本,提出了一种基于样本相似度的特征转换过程(SFTP)来生成扩展特征,并通过PCA对未被选择的特征和扩展特征进行有效地降维和去除噪声特征,从而得到一组紧凑的和补偿的新特征。针对上述局限2,本文结合分类器之间的相似性和各基分类器的分类性能,设计了一种新的基于自适应动态密度剪枝(FPP)的分类器集成剪枝框架(HDRFPF),通过采样基于相似性的密度聚类与基分类器的分类性能的剪枝方法来去除冗余和无效的基分类器。本文在23个高维数据集上的实验验证了所提出的集成模型的有效性,结果显示,其分类性能优于主流的分类器集成方法。
其他文献
目的探讨薄型子宫内膜(Thin Endometrium)患者中医证型分布特点,并对中医证型与一般资料、性六项及甲状腺功能(TSH、FT3、FT4)之间的相关性进行归纳分析,为中西医结合诊治薄
MAX材料兼具金属和陶瓷的优良性能。M4AX3作为一种413相MAX材料,由于实验制备较困难,关于其结构和性能的研究相对较少。为了进一步了解M4AX3,对其X位含有空位以及固溶体时的
亚毫米尺寸的金属波导元件是下一代太赫兹观测设备的关键部件,金属超声增材制造技术有望整体成型金属波导元件,关键环节为紫铜超声波焊接界面的有效连接,因此开展了相关研究
本文以中国A股非金融类上市公司(2007-2018)的年度数据为样本,通过构建固定效应模型,研究了宏观经济政策不确定性影响企业创新的机理及其经济后果。结果表明:(1)在经济政策不确定性上升时,企业会增加创新投入和提高专利申请数量;(2)经济政策不确定性与公司创新的正向相关关系会随着股权集中度的降低、融资约束程度的降低、政府补贴的增多而增强,同时在国有企业中的创新效应优于非国有企业;(3)此外,本文
清朝名臣曾国藩,被政界人士奉为“官场楷模”。一生讲究“廉”。这要从曾国藩第一次被道光皇帝召见说起。那时,已是庶吉士出身的曾国藩,在翰林院实习期满后,早已囊中羞涩。由
党的十八大以来,习近平多次强调斗争精神的重要性,向全党提出了发扬斗争精神、增强斗争本领、讲求斗争艺术的号召,为新时代提升斗争自觉和斗争能力指明了方向。习近平关于斗
党的组织体系建设不同于党的组织建设,是服务于党的组织建设的组织保障。我们党以强有力的组织体系建设打造了百年大党的伟大与辉煌,铸就了党的战斗力、生命力、组织力、号召
加强党的组织建设是一项长期且紧迫、艰巨而复杂的任务,更是探索中国共产党党建工作规律的历史性议题。当下我国正处于实施“十四五”规划、全面建设社会主义现代化国家新征
后数字主义时代,人工智能的出现变革了技术社会的设计媒介。当前针对量化数据模拟的生成式设计已经成为建筑及城市初期决策的重要方法。然而目前大量模拟软件受制于算法黑箱,
近几年随着我国环境问题的接连爆发,人们环保意识逐渐提高,可持续发展的绿色经济理念深入人心,环保产业由此走到大众面前且越发受到关注和重视。环保行业得益于国家相关政策支持,产业市场需求不断扩大,逐步形成庞大产业链条,各环保公司规模增长迅速。但就是这个曾被视作投资界最被看好的板块之一,正面临着重大考验:国内环保板块总体市值在2018年缩水约45%,企业直接融资难度增大,板块内半数企业利润增速为负,整体呈