论文部分内容阅读
门诊量是医院运营管理中的重要指标,对医院管理决策、统筹协定具有重要意义。门诊量的影响因素复杂,且作用方向与程度难以量化,难以通过影响因素来预测门诊量。因此本文从时间序列的角度来分析门诊量数据,通过构建时间序列模型来获取历史门诊量数据的隐藏信息,对未来门诊量进行精准预测,以满足医院卫生管理的需要。目前,在多个领域的预测研究中,模型与预测方法策略的不断更新为复杂多样的时间序列预测提供了灵活的选择。模型的预测性能与数据的关系密不可分,性质不同的模型能从不同角度反映出数据信息,因此本文先分析出某三级甲等医院日门诊量具有周期性与平稳性,月门诊量具有周期性、非平稳性以及趋势性,根据数据的特征分别使用自回归滑动平均模型(Autoregressive Moving Average,ARMA)和三次指数平滑法(Holt-Winters)进行探索性实验,并进行相关讨论。结合前人研究以及预测趋势的发展,选择基于经验模态分解(Empirical Mode Decomposition,EMD)的组合框架进行预测研究,采用集成分解预测的策略,提取复杂序列的多尺度特征,降低序列信息的冗余性。同时为取得满意的效果,先在原有框架下进行优化研究,进而提出一种基于EMD融合多元长短期记忆神经(Long Short-Term Memory,LSTM)网络与邻域算法的预测模型。该方法使用EMD将门诊量数据序列分解成若干子序列,通过子序列的样本熵,选取波动分量与整体分量,根据分量特点建立基于邻域和多元LSTM神经网络的预测模型。主要研究分为两个部分:(1)围绕EMD组合预测框架存在的问题进行研究。在以往研究中,忽视了 EMD分解序列的缺陷带来的预测误差,本文主要对端点效应进行讨论。其次,在EMD组合预测框架发展中缺乏对特征时间尺度信息的充分利用,只采用单因素预测,本文将讨论对多维特征时间尺度信息的构建与应用。综合以上两点研究,本文使用特征矩阵输入和数据延拓的方法来增加在该框架下预测的准确性。(2)围绕序列‘分而治之’预测策略具体细节以及模型组合上进行研究。由于分解后序列的序列复杂性不一致,对此引入样本熵进行序列分类,对波动幅度较大,复杂的序列采用长短期记忆神经网络,对于变化比较稳定的序列,本文引用推荐算法的相关知识,采用基于时间信息的邻域算法进行估算预测。选取日门诊量和月门诊量两组数据作为实验数据,对比已有的代表性预测方法。