Page 109 - 南京医科大学学报自然科学版
P. 109

第42卷第2期             赵子平,许 可,吴 莹,等. 基于深度学习的猩红热流行趋势预测模型研究[J].
                  2022年2月                   南京医科大学学报(自然科学版),2022,42(02):252-257,263                     ·255 ·


                                   发病数据  1 200
                                    1 000
                                     600
                                     200
                                       0
                                                                                          150
                                                                                          100
                                   季节性                                                    50
                                                                                          0
                                                                                          -50
                                                                                          -100
                                     600
                                   趋势  400
                                     200
                                                                                          400
                                   残差                                                     200
                                                                                          0
                                                                                          -200
                                        2005年           2010年         2015年          2020年
                                                               时间
                                      图2 2005—2019年江苏省猩红热月发病数时间序列季节性分解图
                                 Figure 2 Monthly observed cases of scarlet fever in Jiangsu Province,2005⁃2019

                江苏省猩红热逐月发病数据是非白噪声序列,能够                                通过猩红热发病时间序列数据平稳化的过程,
                使用SARIMA模型提取其中的线性关系。                              d=1,D=1。绘制平稳化之后序列的自相关函数图
                    对 2005—2017 年江苏省猩红热逐月发病数序                    (ACF)和偏自相关函数图(PACF)(图3)。通过观察
                列进行 ADF 检验,Dickey⁃Fuller=-2.5436,P=0.349,         偏自相关图,可取 p=2 或 3,P=1;通过观察自相关
                存在单位根,该序列为非平稳序列。对原始序列进                            图,可取q=2或3,Q=0或1。由此可建立8个备选模
                行一阶一般差分以及一阶季节性差分,差分后的序                            型(表1)。
                列经过ADF检验,Dickey⁃Fuller=-4.9266,P=0.01,提               通过比较各个模型的 AIC、BIC,并结合模型显
                示差分处理后的序列为平稳序列。                                   著性检验结果,确定最优模型为 SARIMA(3,1,2)


                            0.2                                      0.2

                            0.1                                      0.1
                           ACF  0.0                                ACF  0.0

                            -0.2                                    -0.2

                            -0.4                                    -0.4
                               0   5   10  15  20  25  30  35           0   5  10  15   20  25  30  35
                                             Lag                                      Lag
                                          图3 平稳化序列的自相关(ACF)和偏自相关(PACF)图
                                       Figure 3 ACF and PACF figure based on stationary time series

                                         表1 SARIMA待选模型的AIC和BIC以及残差白噪声检验
                                    Table 1  Parameters of fitting efficiency of alternative SARIMA models
                                                                                     模型残差白噪声检验(lag=5)
                               模型                      AIC              BIC
                                                                                         χ 2           P
                                                     1 540.78         1 558.55         11.41          0.05
                       SARIMA(2,1,2)(1,1,0) 12
                                                     1 536.54         1 557.28          0.49          0.99
                       SARIMA(3,1,2)(1,1,0) 12
                                                     1 536.04         1 556.78          0.05          1.00
                       SARIMA(2,1,3)(1,1,0) 12
                                                     1 538.03         1 561.73          0.06          1.00
                       SARIMA(3,1,3)(1,1,0) 12
                                                     1 519.14         1 539.88          9.06          0.11
                       SARIMA(2,1,2)(1,1,1) 12
                                                     1 511.45         1 535.15          0.05          1.00
                       SARIMA(3,1,2)(1,1,1) 12
                                                     1 511.49         1 535.19          0.07          1.00
                       SARIMA(2,1,3)(1,1,1) 12
                                                     1 513.44         1 540.11          0.04          1.00
                       SARIMA(3,1,3)(1,1,1) 12
   104   105   106   107   108   109   110   111   112   113   114