基于并行化随机森林算法的大米产地确证平台

来源 :吉林农业大学 | 被引量 : 0次 | 上传用户:caiyoutian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来对地理标志大米产地真伪性鉴别的研究主要集中在基于过程追溯的大米产地溯源系统技术与基于源头鉴别的大米产地确证技术两个方面,其中产地溯源系统中企业为整个溯源提供基础的数据来源,难以避免人为因素对溯源结果造成影响,可能出现“真条码,假溯源”的产地造假现象。而结合机器学习算法的大米产地确证技术虽然获得了较好的鉴别效果,但是在处理大规模数据时,传统的机器学习算法的时间复杂度较高,产地确证模型分类效率较低。因此本文探讨将机器学习算法进行并行化处理,实现对大规模数据的快速分析建模,同时以并行化的产地确证模型为基础构建大米产地确证平台,实现高效、准确、便捷的大米产地确证,进一步完善地理标志大米产地溯源体系。本文采集了梅河、柳河、辉南、延边四个大米主产区共433份大米样本。将检测的矿物质元素含量数据经过预处理后作为建模的基础数据,运用Hadoop分布式集群技术,分别构建了基于MapReduce并行化算法框架的随机森林算法模型、支持向量机模型与人工神经网络模型,对三个模型进行评估与比较后,最终以分类效果最佳的并行化随机森林算法模型为核心开发地理标志大米产地确证平台,文章的主要内容如下:(1)基于MapReduce构建的三种并行化产地确证模型在模型精度与过拟合程度的比较结果表明,并行化随机森林模型相比其他几种算法模型具有更好的分类效果,模型准确率达到97.55%,同时模型的过拟合程度最低,模型泛化能力最佳。(2)通过不同大小规模的数据集测试并行化随机森林算法模型的有效性。其中在数据个数为214条、314条和433条时,模型准确率分别为97.55%、97.85%与98.32%。结果表明,本文构建的并行化随机森林算法随着数据集规模的不断增加,模型准确率呈现上升趋势,模型满足基本需求。(3)以Java作为开发语言,采用浏览器/服务器(B/S)架构和SSH开发框架,设计并实现了大米产地确证平台,平台主要实现用户登录、产地确证与结果展示等多个功能模块,其中政府检测机构人员可以通过登录模块进行身份验证后,在产地确证模块中输入矿物质元素含量信息,在结果展示模块中查看产地确证结果。(4)平台性能评估结果表明,基于并行化随机森林算法模型比传统的串行随机森林算法具有更好的加速比,在处理大规模数据时展现了更高的性能优势。
其他文献
无刷直流电机是一种高效节能电机,近些年获得了很大发展,市场份额不断攀升。无刷直流电机有位置传感器控制系统因为位置传感器的存在,需要在生产和安装时给位置传感器预留位
覆盖率是影响强化研磨效果的一个重要因素,但在整个强化研磨领域对覆盖率的解读和研究探讨是最少的。实际上,表面覆盖率是强化研磨强化的重要参数。目前,基于强化研磨,轴承,
肌萎缩性脊髓侧索硬化、脑卒中等患者大脑意识正常,但是由于运动功能障碍无法正常的与外界环境进行交流。随着经济的发展与医疗水平的上升,残疾人的基本生活和物质水平得到了
深化集体林权制度改革是巩固和完善农村基本经济制度的重要组成,而同时集体林权制度改革也关乎农民的生产增收,农村的社会稳定和生态保护,是乡村振兴战略的重要组成部分。始
本论文尝试以就马克思主义接受观的产生、结构、原则、矛盾关系等方面进行分析,从而对意识形态话语权进行分析,重新审视并对我国的意识形态宣传与教育进行积极探索。马克思主
随着新一轮集体林权制度改革深化落实,林地承包制度由集体经营转变为“三权分置”下的农户家庭经营。由于林业处于生态建设时期,因而政府的林业政策规制着林区农户的林地经营
德国蔡司公司发明的IOLMaster人工晶体生物测量仪创新性地解决了精确测量眼睛和手术前对眼球晶体进行精确计算的难题。目前IOLMaster 700作为最新一代的人工晶体生物测量仪已
随着电力行业的快速发展,电力基础设施建设不断向偏远地区延伸。施工队常在地形复杂,手机信号差的山区进行施工。这给安全管理带来挑战:由于视野受限与人员分散,安全人员对工
本文尝试以马克思共同体思想为视角重新审视分配正义问题,试从“虚假共同体”、社会主义阶段和“真正的共同体”对分配正义问题分别展开讨论,为新时代中国特色的分配正义提供
无线中继通信技术能够扩大通信覆盖范围,提高信息传输的可靠性;多中继技术可以有效提高通信网络的分集增益,在提高系统可靠性的同时提高系统有效性;多天线技术可以提高系统容量和改善链路的传输可靠性。因此在提高通信网络系统性能的前提下,研究中继通信技术有着重要大意义,提高通信网络的可靠性和有效性是现今通信的追求,进一步讲,由于无线中继节点的电池容量受限,由此研究新型的无线携能传输技术非常必要。针对能量采集的