Page 122 - 南京医科大学学报自然科学版
P. 122

第41卷第2期
               ·272 ·                            南 京    医 科 大 学 学         报                        2021年2月


                         表5 两种模型的拟合效果比较                         数平滑模型整体与真实曲线相对拟合效果较好。
              Table 5  Comparison of the fitting effects of the two mod⁃
                      els                                       3  讨 论
                                ARIMA          Holt⁃Winters          肺结核作为一种成因复杂的慢性传染病,其发
                  指标
                                                                病率高、病死率高,严重威胁人类的健康。随着人
                           (0,1,1)×(1,1,2) 12  加法指数平滑法
                RMSE             76.27           69.61
                                                                们生活水平的提高与医疗技术的进步,结核病在一
                MAE              57.62           50.17
                                                                定程度上得到了控制,但与此同时,耐多药肺结核
                MAPE(%)          16.00           14.58
                                                                的流行、人口老龄化加速,又给肺结核的防治工作
                                                表6 两种模型对预测值的误差比较
                               Table 6 Comparison of relative errors on predicted values between two models
                                                                                   Holt⁃Winters加法指数平滑法
                                                    ARIMA(0,1,1)×(1,1,2) 12
                    时间              实际值
                                                   预测值            相对误差             预测值            相对误差
                  2018年1月             503          408.45           0.190          436.29           0.130
                  2018年2月             351          343.36           0.020          357.41           0.020
                  2018年3月             583          556.58           0.050          582.61           0.001
                  2018年4月             566          567.09           0.002          603.86           0.070
                  2018年5月             630          555.54           0.120          587.72           0.070
                  2018年6月             603          593.81           0.020          603.48           0.001
                  相对误差和               —              —              0.402            —              0.292


                                                     真实值        的变化模式,并将这种规律外延,以此来预测未来
                 900
                                                     ARIMA
                 800                                 指数平滑法      现象  [12] 。ARIMA模型综合考虑了序列的趋势、周期
                ( 例 )  700                                      的变化及随机干扰等情况,并用模型参数进行了量
                 600
                发病人数  400                                       化,能较好地反映时间序列的趋势和变化,并能判
                 500
                 300
                 200                                            断季节效应、趋势效应和随机波动等因素。但ARI⁃
                                                                MA模型依赖于大量的历史数据,建模过程较复杂,
                 100
                  0                                             模型的参数常不容易确定,且要求序列在相当一段
                               2012年1月
                                                  2018年1月
                                            2016年1月
                                     2014年1月
                  2008年1月
               2007年1月 2009年1月 2011年1月  2013年1月  2015年1月 2017年1月  时间内保持相对的平稳才能实现预测的精确有效,
                         2010年1月
                                     时间                         故在拟合模型之前,通常需要对非平稳序列进行差
                     图5 实际值与两种模型拟合值序列比较图                        分等转换。指数平滑模型是基于对移动平均预测
               Figure 5  Actual value series and fitted value series of the  方法的改进,其综合运用临近的值、整体趋势和季
                       two models                               节性来进行预测分析,按均方误差最小的原则来确
                                                                定平滑系数,对近期的值给予更大的权重,因此近
              带来了新的挑战。此外,流动人口对肺结核防治知                            期数据对结果影响较大,而远期数据则影响较小,适
              识掌握率较低,结核病就诊率低,这也是肺结核防                            用于分析随时间变化不大的数据。相对于ARIMA模
              治工作中的难题 。上海市地理位置独特,经济发                            型,指数平滑模型的建模过程更简单一些 。对于上
                                                                                                    [15]
                             [9]
              达,人口流动性大,上海地区结核病的防治工作尤                            海市肺结核发病的历史数据,本文的研究结果显
              其需要重视。                                            示,ARIMA(0,1,1)×(1,1,2) 12模型 RMSE 为 76.27,
                  目前对传染病疫情进行预测的模型有动态因                           2018年1—6 月预测值的相对误差和为 0.402;运用

              子模型、BP人工神经网络模型、马尔可夫链(Markov                       指数平滑法构建的最优模型是 Holt⁃Winters 加法指
              模型)、广义回归神经网络(GRNN)模型、ARIMA 模                      数平滑,其 RMSE 为 69.61,2018 年 1—6 月预测值的
              型等  [10-14] 。本文所采用的 ARIMA 模型和指数平滑                 相对误差和为 0.292,效果优于 ARIMA 乘积季节模
              模型都属于时间序列模型,其基本原理都是通过揭                            型。由此推断,Holt⁃Winters加法指数平滑模型更适
              示历史数据随时间的变化规律,确定已有时间序列                            合用于上海市肺结核疫情的短期预测。
   117   118   119   120   121   122   123   124   125   126   127