【摘 要】
:
分类是数据挖掘领域中进行预测性建模的一类非常有效的方法。它通过构建一个目标函数(又称分类器或者分类模型),将数据集中的类标号未知的样例映射到某个已知类别。在实际生
论文部分内容阅读
分类是数据挖掘领域中进行预测性建模的一类非常有效的方法。它通过构建一个目标函数(又称分类器或者分类模型),将数据集中的类标号未知的样例映射到某个已知类别。在实际生活中也有着广泛的应用,包括欺诈检测,目标营销,风险评估,医疗诊断。现有阶段分类的方法较多,其中,朴素贝叶斯分类器凭借其特有的不确定性知识表述形式、扎实的统计理论基础、综合先验知识的增量学习方式以及简单高效等特性成为现有分类算法的一个研究热点。根据分类算法的对比研究可知,基于类条件独立性假设的朴素贝叶斯分类模型能与决策树和神经网络等分类模型相提并论,甚至可以在某些领域表现出更好的分类性能。但是在多数情况下,类条件独立性假设是违背现实的,假设的违背会显著降低分类精度。基于此事实,可提出这样的一个问题:放松朴素贝叶斯分类器严格的类条件独立性假设可否能进一步改善其分类性能。本文将朴素贝叶斯分类模型作为基本对象,研究分析了四种常见的改进模型。同时本文针对类条件独立性假设提出了结合奇异值分解与主成分分析的改进方法,将奇异值分解、主成分分析和朴素贝叶斯模型结合,达到改进分类效果的目的。又在上述方法的基础上,考虑到各个变量对分类效果不同程度的影响,提出了结合奇异值分解与主成分分析的加权改进方法。最后仿真实验结果证实了本文改进方法的有效性。
其他文献
随着书法热潮的推进,“书学”一词被广泛使用,但“书学”概念和研究范畴皆没有准确界定。期间虽不乏言论,然其界定依据不明。笔者以为“书学”概念并非简单的定义问题,势必需
<正>“线上线下平台三天销售600万斤,不仅解决了苹果滞销的问题,还为山东日照、山西祁县、陕西旬邑县、甘肃静宁县等地果农搭建起了一条走出大山的绿色通道。”日前,苏宁在“
对画学研究并非简单定义问题,势必要利用文献学的方法,梳理画学文献在古代官修史书中的收录情况。魏晋以前把绘画当作礼教之用,追求实用主义;魏晋以后到两宋之前,是绘画宗教化时期
本文论述了中国古代史馆官修史书制度为后世留下的重要史学业绩,它所涉史籍之深之广,在当今世界上恐怕也是独一无二的。但是,官修制度也为后代留下了诸多遗憾。
基于Fick第二定律,在氯盐一维侵蚀模型的基础上,发展了氯盐二维侵蚀模型。考虑参数的随机性,采用Monte-Carlo方法,对比分析了两种侵蚀模型下RC结构锈胀开裂风险。研究表明:在
<正>欢迎订阅地址:天津市东丽经济开发区先锋东路68号邮编:300300E-mail:
[email protected]为全面客观地反映我国摩托车工业发展的历程和现状,中国汽车技术研究中心《摩托车技
分析了在中国石油天然气集团公司开展风险管理审计的制约因素,如公司治理结构存在缺陷、风险管理理念尚未深入人心、缺乏可供借鉴的成功案例等,在此基础上提出了风险管理审计
背景:在正常生理状态下,血小板和血管内皮细胞表面均带有不等量的负电荷,血管内皮细胞和血小板表面通过负电荷相互排斥可防止血小板与血管内壁的接触,保持血流通畅。在血管壁
本文介绍我国企事业单位在开展项目建设、生产运营过程中,环境保护工作的实施情况。根据具体实例,分析环境咨询服务的形式,提出委托环保咨询服务单位针对企业的实际情况,辅助
巴赞的摄影影象本体论,揭示了一般电影的本体存在。本文在区分一般电影与作为艺术的电影的前提下,阐述叙事对于电影艺术的本体论意义。首先,从对电影及电影艺术的发明史的考