论文部分内容阅读
近年来卫生部资料调查显示,心血管和呼吸系统疾病的发病率位于前列,并有逐年升高的趋势。这些慢性疾病通常门诊表现为急性发作,针对该类疾病的预防对诊疗系统具有十分重要的作用。心血管与呼吸系统疾病的产生与复发和连续的气象因素条件有着紧密的联系。过去大量学者针对门诊时间序列进行预测的模型大多为统计模型,其预测误差较大、消耗时间过长,预测效果达不到解决实际问题的要求。而随着机器学习与深度学习的发展,长短期记忆神经网络(Long Short-Term Memory,LSTM)在多因子时间序列预测方面取得了较好的效果。本文研究对象包括气象因素与慢性疾病门诊量两类时序数据,利用LSTM神经网络为基础模型对两者建立预测模型并加以改进。为了更好地挖掘气象与慢性疾病门诊量之间的关联信息,提高短期门诊预测精度,本文针对LSTM神经网络的特征选择效率不高的问题,提出将卷积神经网络(Convolutional Neural Networks,CNN)与LSTM神经网络相融合的预测模型。其中CNN用于接收输入数据、压缩和提取其中的重要特征因素,LSTM用于接收CNN层的输出,提取其中的时间序列特征,最终得到预测结果。在控制了高血压门诊相关特征因素的不变基础上,利用Python编程语言实现对甘肃省四个地区的高血压门诊量序列建立CNN-LSTM混合预测模型,实验结果显示预测拟合程度较好。根据实验结果对高血压门诊人数的变化趋势进行预测分析,从而为高血压疾病的预防和控制提供更准确的参考依据。在时间序列数据的预测问题中,为了提高时间序列的预测精度,提出了一种基于改进的遗传算法优化长短期记忆神经网络的时序预测模型。针对传统遗传算法局部搜索能力较差的问题,提出改进的多级交叉概率,有效地避免了在寻优过程中陷入局部最优。对于多变量LSTM时间序列预测模型,将改进后的遗传算法用于优化隐藏层中的单元数以及优化特征选择。将改进后的模型与四种对比模型分别在四组公共数据集上进行实验,进一步验证改进后的模型可以有效地处理相关因素和目标序列之间的动态关联关系,并能极大地提高LSTM网络的性能和时间序列预测的精度。实验结果表明,优化后的时序预测模型相比于传统的LSTM神经网络泛化能力更强、预测精度更高,对于数据量较大和波动较大的数据可以实现更好的拟合。最后将改进遗传算法优化LSTM网络的时序预测模型应用于甘肃四地区门诊量时序数据的预测上,分别对甘肃四个地区的肺心病和慢阻肺两种疾病门诊量建立短期预测模型,通过实验验证本文模型具有很好的预测性能。对预测结果的差异进行分析,得出不同区域的气象因素对慢性疾病门诊量的变化有不同影响。