基于机器学习的乙类传染病预测模型研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:shensq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于传染病的发展趋势尚不清楚,这意味着预测传染病的发病情况并不容易。随着机器学习和深度学习研究的不断深入,尤其是LSTM循环神经网络的大量研究,使得很多难以预测的问题得到了更好的解决。本文通过调研发现还没有将LSTM循环神经网络应用在传染病预测领域的研究。本文将LSTM神经网络应用在传染病预测领域是一次大胆的尝试。通过利用天气数据、经济数据、人口数据等,并将这些数据结合传染病发病个案数据一并进行传染病预测的研究,取得了良好的传染病预测效果。首先通过数据预处理分析现有数据,提取出有用的特征因素,例如,本文通过数据分析可知,影响传染病发病情况除以上所述外还有年龄因素、性别因素、职业因素等等。本文通过ARIMA和LSTM的对比实验发现,预测所有传染病的发病情况时LSTM模型优于ARIMA模型,同时又将所有数据划分为多个时间段的预测,例如,分月预测、分周预测、分日预测,在预测时间段的选择上,本文通过实验发现分周预测的效果是最优的。在预测未来一周的传染病发病情况时,其中LSTM模型的RMSE指标值为188.59,而ARIMA模型的RMSE指标值为336.88。本研究在确定了分周预测效果最优的前提下,又提取单一疾病病种的数据集来做预测,在其他数据一致的情况下,以预测肝炎、肺结核、梅毒等发病的情况来对比ARIMA模型和LSTM模型的优劣。从预测效果来看,LSTM模型优于ARIMA模型。以上实验结果表明,LSTM循环神经网络更准确,更适合用于乙类传染病预测的研究。经过以上对比实验后,本文决定使用LSTM循环神经网络来预测传染病的发病情况,并将预测结果的多种指标做成了一套完善、高性能的可视化系统。我们相信这项研究可以消除现有传染病监控系统中的报告延迟和预测不准确等问题,从而最大限度降低社会成本,本系统也已经在四川省疾病预防控制中心内部试用。
其他文献
骨髓间充质干细胞(bone marrowmesenchymal stem cells,BMSC)是具有多方向性分化潜能的干细胞,它可以向骨、软骨、脂肪、血管内皮、神经、肌腱、肌肉等多种组织分化,因此BMSC
近年来,我国统计信息失真的现象比较严重,破坏了统计工作的正常秩序,损害了党和政府的形象,给社会经济生活带来了严重的影响,从管理体制、监督体系、法律法规、统计人员的综
<正> 唐王朝是我国封建社会发展中的一个鼎盛时期。这一时期的文化艺术,在封建社会里呈现出了万紫千红的繁荣景象。由于唐太宗李世民、高宗李治特别重视音乐的社会作用,故为
试验选用9窝83头断奶仔猪为试验对象(平均断奶日龄为28d),随机分成3组。分别饲喂在基础日粮中添加0.1%,2%柠檬酸的饲粮,探讨饲喂不同PH值的日粮对断奶仔猪腹泻程度及平均个体增
<正>1问题引入(2003年高考数学北京卷第18题)如图1,椭圆的长轴A1A2与x轴平行,短轴B1B2在y轴上,中心为M(0,r)(b>r>0)。(Ⅰ)写出椭圆的方程,求椭圆的焦点坐标及离心率。(Ⅱ)直线y=k1x交椭
唐开元中前期士风之变杜晓勤与武后、中宗朝士人们相比,开元士人不但普遍具有更为强烈的功名意识、进取精神,而且其人生理想也更加雅正,因为开元士人已不是只局限于追求一己之利
目的和方法 :在延髓头端腹外侧区 (rVLM )内注射肾上腺素 (E)旨在观察能否影响正常大鼠的血压和心率 ,并分析rVLM内肾上腺素能机制在应激性升压反应和心动过速中的作用。将清
<正> 光线由于光源不同分为天然光源(如太阳光)和人工光源,不管是天然光或人工光对档案文件都有一定的破坏作用。而其中破坏最大的是紫外线。一、紫外光能量大光是发光体(光
<正>自2012年9月以来,浙江省开展了以重点企业研究院建设为主体的新兴产业技术创新综合试点建设。截至目前,全省已在纯电动汽车、现代医药、智慧城市专用软件等13个新兴产业
<正>糖尿病眼病是糖尿病并发症的一种,具有很大的危害性,严重的糖尿病眼病可能会导致患者失明。遗憾的是,糖尿病眼病初期可能毫无症状,因此很难发现。随着病情的加重,症状也