论文部分内容阅读
目的本研究旨在了解广州市登革热分布和影响因素,并基于广州市登革热相关关键词百度搜索指数(BSI)结合气象、媒介历史数据,构建登革热预测模型为应对广州市登革热疫情提供决策依据。方法系统收集2017-2019年广州登革热疫情及气象、蚊媒密度数据,挖掘登革热相关关键词BSI,采用描述性方法描述其流行病学特征。应用广义线性模型(GLM)和广义相加模型(GAM)分析相关的影响因素及效应。对气象数据、媒介数据、关键词BSI进行相关分析和重要性筛选,采用三种机器学习算法(反向传播神经网络(BP)、随机森林回归(RF)、支持向量回归(SVR))分别对广州市登革热疫情进行回归预测,并用R~2、RMSE等评估模型预测效果。使用SPSS22.0、R3.6.0、MATLAB(2017)等软件进行统计分析或训练模型。结果1.2017-2019年广州市登革热发病率依次为6.12/10万,8.16/10万,9.27/10万,呈上升趋势(χ~2=85.306,P<0.001);夏秋季高发,占比99.77%,发病高峰10月,占38.42%;病例主要分布于中心城区(占82.83%),受影响的街道占街道总数的比例逐年上升(趋势χ~2=13.157,P<0.001);18-60岁(77.21%)占病例大多数;男性发病率(8.17/10万)高于女性(7.50/10万),差异有统计学意义(χ~2=6.367,P<0.012);职业分布中,家务及待业、商业服务人员、工人、离退人员、学生共占72.11%。2.GLM模型显示:前2月的平均气温和24小时降水量对广州登革热疫情有显著影响。在其他因素保持不变前提下,这些因素每增加1单位,每月登革热发病风险分别提高1.18倍、1.06倍。3.GAM模型显示:前2月的布雷图指数(BI)、平均气温、平均气压和24小时降水量、前1月的平均湿度对广州登革热每月发病数有显著影响。当其他协变量保持不变的情况下,这些因素每增加1单位,每月登革热发病风险分别增加1.38倍、2.21倍、1.23倍、1.12倍、1.08倍。平均气压与日照时数之间存在交互效应(F=4.575,P=0.007)。4.气象因素如气温、日照时数与登革热发病数存在滞后正相关关系,气压与发病数成滞后负相关关系。前2月的平均气温、前2月的平均气压与发病数的Spearman相关系数分别达到0.934、-0.949(P均<0.001)。5.媒介密度指标与登革热发病数存在滞后正相关关系。其中前2月的BI、SSI、MOI,前3月的ADI与发病数之间的Spearman相关系数分别是0.934、0.931、0.936、0.622(P均<0.001)。6.关键词BSI与登革热疫情趋势存在相关关系。其中“登革热”BSI与登革热发病数相关性最高,日、周、月Spearman相关系数分别达到0.793、0.845、0.862(P均<0.001)。7.日发病数预测,筛选了5个变量(“登革热”BSI、“预防登革热”BSI、“登革热症状”BSI、63天前平均气压、63天前平均气温),构建BP、RF、SVR模型并用三年时间序列数据集的前70%训练,后30%验证,R~2分别达到0.523、0.709、0.637,RMSE分别为5.146、3.823、3.906。8.周发病数预测,筛选了5个变量(“预防登革热”BSI、9周前平均气压、9周前最大气压、“登革热”BSI、9周前最低气压),构建BP、RF、SVR模型。用三年时间序列数据集的前70%训练,后30%验证,R~2分别达到0.783、0.784、0.841,RMSE分别30.805、20.049、19.246。9.月发病数预测,筛选了4个变量(2月前平均气压、“预防登革热”BSI、2月前的BI、2月前最低温度),构建BP、RF、SVR模型。用三年时间序列数据集的前70%训练,后30%验证,R2分别达到0.863、0.878、0.862,RMSE分别是67.943、64.138、72.164。结论1.本研究表明,近三年登革热发病率呈现逐年上升趋势,应加强防控力度;2.气象因素和媒介因素与广州市登革热发病数间存在一定的滞后相关和滞后效应关系,控制登革热应提前并持续采取媒介控制措施;3.本文基于2017-2019年广州市数据分析表明,既往气象因素以及近实时的登革热相关关键词BSI、媒介指数BI可预测广州市登革热疫情趋势,为广州市登革热监测预警提供辅助决策支持。