Page 122 - 南京医科大学学报自然科学版
P. 122
第41卷第2期
·272 · 南 京 医 科 大 学 学 报 2021年2月
表5 两种模型的拟合效果比较 数平滑模型整体与真实曲线相对拟合效果较好。
Table 5 Comparison of the fitting effects of the two mod⁃
els 3 讨 论
ARIMA Holt⁃Winters 肺结核作为一种成因复杂的慢性传染病,其发
指标
病率高、病死率高,严重威胁人类的健康。随着人
(0,1,1)×(1,1,2) 12 加法指数平滑法
RMSE 76.27 69.61
们生活水平的提高与医疗技术的进步,结核病在一
MAE 57.62 50.17
定程度上得到了控制,但与此同时,耐多药肺结核
MAPE(%) 16.00 14.58
的流行、人口老龄化加速,又给肺结核的防治工作
表6 两种模型对预测值的误差比较
Table 6 Comparison of relative errors on predicted values between two models
Holt⁃Winters加法指数平滑法
ARIMA(0,1,1)×(1,1,2) 12
时间 实际值
预测值 相对误差 预测值 相对误差
2018年1月 503 408.45 0.190 436.29 0.130
2018年2月 351 343.36 0.020 357.41 0.020
2018年3月 583 556.58 0.050 582.61 0.001
2018年4月 566 567.09 0.002 603.86 0.070
2018年5月 630 555.54 0.120 587.72 0.070
2018年6月 603 593.81 0.020 603.48 0.001
相对误差和 — — 0.402 — 0.292
真实值 的变化模式,并将这种规律外延,以此来预测未来
900
ARIMA
800 指数平滑法 现象 [12] 。ARIMA模型综合考虑了序列的趋势、周期
( 例 ) 700 的变化及随机干扰等情况,并用模型参数进行了量
600
发病人数 400 化,能较好地反映时间序列的趋势和变化,并能判
500
300
200 断季节效应、趋势效应和随机波动等因素。但ARI⁃
MA模型依赖于大量的历史数据,建模过程较复杂,
100
0 模型的参数常不容易确定,且要求序列在相当一段
2012年1月
2018年1月
2016年1月
2014年1月
2008年1月
2007年1月 2009年1月 2011年1月 2013年1月 2015年1月 2017年1月 时间内保持相对的平稳才能实现预测的精确有效,
2010年1月
时间 故在拟合模型之前,通常需要对非平稳序列进行差
图5 实际值与两种模型拟合值序列比较图 分等转换。指数平滑模型是基于对移动平均预测
Figure 5 Actual value series and fitted value series of the 方法的改进,其综合运用临近的值、整体趋势和季
two models 节性来进行预测分析,按均方误差最小的原则来确
定平滑系数,对近期的值给予更大的权重,因此近
带来了新的挑战。此外,流动人口对肺结核防治知 期数据对结果影响较大,而远期数据则影响较小,适
识掌握率较低,结核病就诊率低,这也是肺结核防 用于分析随时间变化不大的数据。相对于ARIMA模
治工作中的难题 。上海市地理位置独特,经济发 型,指数平滑模型的建模过程更简单一些 。对于上
[15]
[9]
达,人口流动性大,上海地区结核病的防治工作尤 海市肺结核发病的历史数据,本文的研究结果显
其需要重视。 示,ARIMA(0,1,1)×(1,1,2) 12模型 RMSE 为 76.27,
目前对传染病疫情进行预测的模型有动态因 2018年1—6 月预测值的相对误差和为 0.402;运用
子模型、BP人工神经网络模型、马尔可夫链(Markov 指数平滑法构建的最优模型是 Holt⁃Winters 加法指
模型)、广义回归神经网络(GRNN)模型、ARIMA 模 数平滑,其 RMSE 为 69.61,2018 年 1—6 月预测值的
型等 [10-14] 。本文所采用的 ARIMA 模型和指数平滑 相对误差和为 0.292,效果优于 ARIMA 乘积季节模
模型都属于时间序列模型,其基本原理都是通过揭 型。由此推断,Holt⁃Winters加法指数平滑模型更适
示历史数据随时间的变化规律,确定已有时间序列 合用于上海市肺结核疫情的短期预测。