【摘 要】
:
随着信息技术的发展和智能终端的普及,人类社会逐渐步入人工智能时代。数据产生与收集的方式发生了巨大变化,呈现出大规模、实时更新、包含噪声的特点。针对当前数据大容量的特点设计高效并且具有鲁棒性的数据降维算法,成为机器学习领域关注的焦点。通过保持数据中条件属性和决策标签之间的不一致性不变,粗糙集属性约简从数据中删除冗余的条件属性以达到数据降维的目的。由于数据规模的不断增大与动态更新,当前的属性约简算法面
论文部分内容阅读
随着信息技术的发展和智能终端的普及,人类社会逐渐步入人工智能时代。数据产生与收集的方式发生了巨大变化,呈现出大规模、实时更新、包含噪声的特点。针对当前数据大容量的特点设计高效并且具有鲁棒性的数据降维算法,成为机器学习领域关注的焦点。通过保持数据中条件属性和决策标签之间的不一致性不变,粗糙集属性约简从数据中删除冗余的条件属性以达到数据降维的目的。由于数据规模的不断增大与动态更新,当前的属性约简算法面临如下的挑战:一是在现有的硬件环境下,如何实现对动态及大规模数据的属性约简;二是针对数据扰动现象,如何提高基于不一致性不变的约简的鲁棒性。针对上述两个问题,本文研究了属性和样本同时增加时,经典粗糙集和模糊粗糙集的属性约简增量机理,并借鉴机器学习的正则化方法研究了鲁棒属性约简的理论和算法。主要研究内容及成果如下:(1)研究了样本和属性同时增加时经典粗糙集属性约简的增量机理。通过辨识关系,设计了新增样本和属性对于更新当前约简必要性的判断机制,并揭示了属性和样本之间在更新约简时的相互制约关系。对于更新当前约简不必要的样本和属性,将其存入数据而不是过滤;对于必要的样本和属性,通过增量计算辨识关系来实现约简的增量计算。基于样本和属性同时增加的统一增量机理设计了经典粗糙集属性约简的增量算法,实验验证了该算法在处理样本和属性同时增加时经典粗糙集增量属性约简的效率和有效性。(2)研究了样本和属性同时增加时模糊粗糙集属性约简的增量机理。利用相对辨识关系实现了对模糊粗糙集中样本和属性的统一描述,为模糊粗糙集中样本和属性同时增加时属性约简增量机理的分析提供了理论基础。通过分析样本增加和属性增加分别带来的相对辨识关系的变化,将属性增加的增量机理和样本增加的增量机理有机的融合到一起,提出了样本和属性同时增加的统一增量机理。当新增样本和属性不断加入时,通过判断相对辨识关系来决定其对当前约简的更新是否必要,从而实现冗余属性的有效删除和必要属性的合理加入。基于属性和样本同时增加的统一增量机制设计了模糊粗糙集属性约简的增量算法。数值实验结果证明该算法能有效处理属性和样本同时增加时模糊粗糙集的增量属性约简。(3)研究了鲁棒属性约简的理论和方法。由于粗糙集对数据噪声敏感,保持一致性不变所得的约简不具有鲁棒性。借鉴机器学习的正则化方法,根据数据类型的不同,分别研究了经典粗糙集和模糊粗糙集的鲁棒属性约简的理论和方法。利用正则化方法,在决策规则的经验误差和整个决策系统的粒度之间寻找一种平衡,以忽略支持度较低的决策规则为代价换取决策规则的泛化能力。基于正则化损失函数的优化策略,设计了鲁棒约简算法,将约简中辨识能力较弱的属性进一步删除,以此提高决策规则的泛化能力。将粗糙集的鲁棒约简算法应用到电厂煤耗的关键特征选取中,并以关键特征作为输入变量建立了煤耗模型。实验结果证明本文所提出的鲁棒约简算法能够有效的删除辨识能力较弱的属性,提高约简的鲁棒性。
其他文献
基于配电系统需求和数字技术发展趋势,对数字化主动配电系统(digitalized ADS, D-ADS)进行了分析和展望。首先,简要梳理配电数字化发展现状,在此基础上初步提炼了D-ADS的定义和主要特征,借鉴基于模型的系统工程方法建立了D-ADS的形式化模型。其次,分别以设备数字化和系统数字化2个维度为例,探索D-ADS的潜在技术应用,梳理D-ADS的技术挑战并提出有关建议。最后,对D-ADS的特
【目的/意义】构建基于用户动态画像的学术新媒体信息精准推荐模型是满足学术新媒体用户对学术信息资源精准化、个性化与专业化的要求,同时也是提高学术信息流转效率以及价值增值的有效途径。【方法/过程】在探究学术新媒体信息流转模型的基础上,进一步分析学术新媒体用户需求与分层画像,重构学术新媒体用户画像步骤,构建基于用户动态画像的学术新媒体信息精准推荐模型。【结果/结论】基于用户动态画像的学术新媒体信息精准推
电容层析成像技术(Electrical Capacitance Tomography,ECT)是一种极具应用前景的可视化成像技术。成像质量低制约了 ECT技术的应用,本文主要通过研究计算成像方法提高图像质量,主要的工作总结如下:(1)定性分析了常规迭代和非迭代成像算法的数学原理与优缺点,定量评价了线性反投影算法、Tikhonov正则化算法、Landweber迭代算法、共轭梯度算法、代数重建算法、同
基于相变材料的相变储热技术是平衡可再生能源及工业余热利用过程中能源供应与需求关系,实现能量合理高效配置的有效手段。为满足中高温相变储热系统的需求,选取相变潜热较高、过冷度低的LiNO3-NaNO3二元盐作为相变材料,选取化学稳定性较好、导热性能优异及成本较低的膨胀石墨(EG)作为改善材料导热性能的手段,对LiNO3/NaNO3-EG复合材料的热物性及循环稳定性等方面进行研究;针对提高热电联产机组调
随着电网建设规模的持续扩大以及电网技术不断革新,每年有大量供电设备因为种种原因,不得不在健康状况良好的情况下退出运行,造成大部分电网退役资产只能作为废旧物资处置,给电力企业造成了大量的不必要的经济损失。如何解决电网资产再利用也成为企业降本增效的重要课题和迫切需要。近年来,以移动互联、云计算、大数据、物联网、人工智能等为代表的新一代信息技术日趋成熟并得到广泛应用。
对佛山地铁2号线盾构掘进过程中采用的冷冻钢管片法更换盾尾刷的施工工艺进行介绍。主要通过对冷冻钢管片的设计介绍、积极冻结及维护冻结期间的温度监测分析,论证此冷冻钢管片法更换尾刷工艺的可靠性,并分析了冻结效果对各施工、设计因素的敏感性。结果表明通过合理的选择停机点,冷冻钢管片法对土体具有高效的冻结效果,其外围的冻结壁发展速度良好,冻结体温度可以满足设计要求;在整个维护冻结期间,冻结体温度稳定地维持较低
"长臂管辖"已逐渐代替传统军事武器,成为美国维护国际政治影响力和经济利益的重要手段和工具,其滥用对他国经济主权构成了严重威胁。鉴于对"长臂管辖"的研究已经超出传统法律范畴,本文从政治经济学角度进行扩展,基于国际经济竞争、全球治理挑战、大国战略博弈三个维度来解释美国滥用"长臂管辖"的动因,并对其背后的政治、经济和战略考量等进行深入剖析。结合法国遭受"长臂管辖"打压的历史教训,文章系统梳理了近年来法国
目的:观察祛寒除痹汤联合双氯芬酸钠治疗类风湿性关节炎的临床疗效。方法:将类风湿性关节炎60例随机分为对照组和观察组,每组各30例;对照组给予双氯芬酸钠治疗,观察组在对照组治疗的基础上加用祛寒除痹汤治疗,2组均以7 d为1个疗程,共治疗4个疗程;观察比较2组临床疗效,治疗前后患者晨僵时间、关节疼痛数量、关节红肿数量变化及血沉(ESR)、类风湿因子(RF)水平变化。结果:总有效率观察组为90.00%,
蛇发美女美杜莎是古希腊神话中一个复杂矛盾的文化符号,她是众神世界里唯一的凡人之身。集美丽与邪恶为一体的美杜莎形象蕴含了很多的故事和冤屈,给后人留下无限遐想、重述和阐释的空间。南非-博茨瓦纳作家贝西·黑德在自传体小说《权力之问》中将美杜莎改写成黑色皮肤,既揭露了西方文化符号的本质特性——想象和权威化,也揭露了非洲民族主义者趋向极端的疯狂权力欲望和排他性,具有深刻的警示性。
[研究目的]介绍“人-数交互”(human-data interaction HDI)研究国外研究近况,希望引起国内图书情报界同行关注,并参与“人-数交互”研究。[研究方法]搜集、编译国外相关文献,分别从“HDI”的基本概念定义与特定观点、“HDI”研究进展、“HDI”的开放性研究挑战3个视角综述,并对我国图书馆情报界参与“HDI”研究提出若干建议。[研究结论]“HDI”研究有助于全面正确地利用自