Page 115 - 南京医科大学学报自然科学版
P. 115

第42卷第1期            孙燕群,张守刚,陆墨原,等. 基于SARIMA模型的南京地区蚊虫侵害的预测研究[J].
                  2022年1月                     南京医科大学学报(自然科学版),2022,42(01):108-111                       ·109 ·


                进行判断。                                             2.2  SARIMA模型构建
                1.2.4 模型构建                                        2.2.1 模型准备阶段
                    SARIMA 是ARIMA 中的一种,主要分为季节乘                        经 Box⁃Pierce 函数进行检验,序列为非白噪
                积和季节相加两种,以季节乘积为多,主要处理序                            声序列(P < 0.01),经 ADF 检验不平稳(Dickey⁃
                列的季节效应、长期趋势效应和随机波动之间存在                            Fuller=-2.275,P=0.466),后经一阶差分后ADF检验
                复杂的交互影响关系。SARIMA 乘积模型公式为:                         平稳(Dickey⁃Fuller=-3.853,P < 0.05)。
                                d
                             D
                ΦP (B)φ(B)∇ ∇ =δ+ΘQ (B)θ(B)wt,也可以简化               2.2.2 SARIMA模型预测
                    S
                                          S
                               xt
                             S
                为SARIMA(p,d,q)×(P,D,Q)s,其中,p、d、q分别表                   参数判断:分别对 2 次差分绘制自相关函数
                示短期相关模型的自回归、趋势差分、移动平均的                           (auto correlation function,ACF)图和偏自相关函数
                阶数,P、D、Q 分别表示季节趋势的自回归、趋势差                        (partial ACF,PACF)图,差分后的ACF图和PACF图
                分、移动平均的阶数,s 表示周期时间间隔。使用                           见图 2。1 阶差分的自相关图非截尾,q 考虑取 0,
                Box.test 中的 Ljung⁃Box 函数进行残差白噪声检验。                偏自相关图为 2 阶截尾,p 考虑可取 1 和 2;季节差
                经过残差诊断合格后可以对模型进行预测。                               分之后的自相关图呈现显著非零,Q 考虑取 0,偏自
                1.2.5 模型评价                                        相关图在 lag12 处有 spike,P 考虑取 1。利用可能的
                    选择平均误差(mean error,MSE)、均方根误差                  参数,分别建立 ARIMA(1,1,0)(1,1,0) 12或者 ARI⁃
               (root mean squared error,RMSE)、平 均 绝 对 误 差         MA(2,1,0)(1,1,0) 12 模型,计算最小信息量准则
               (mean absolute error,MAE)、平 均 绝 对 比 例 误 差         (AIC)值,其中前者 AIC=114.57,后者 AIC=113.54,
               (mean absolute sacled error,MASE)和决定系数 R 进         综合考虑ARIMA(2,1,0)(1,1,0) 12模型。
                                                           2
                行模型拟合效果的评价。
                                                                            1.0
                1.3  统计学方法
                                                                            0.8
                    研究人员将蚊密度按照时间 2015 年 1 月—
                                                                            0.6
                2019年12月进行整理,用Excel2013进行汇总,建立                              0.4
                时间序列,利用 R x64 4.0.3 软件及下载的 forecast、                      ACF
                                                                            0.2
                tseries包进行统计学分析,P < 0.05为差异有统计学
                                                                            0.0
                意义。
                                                                           -0.2
                2  结 果                                                     -0.4
                                                                               0   0.2  0.4  0.6  0.8  1.0  1.2
                2.1  序列概况                                                                 滞后
                     绘制 2015—2018 年蚊虫侵害数据的时间序列
                分解图(图 1),可以看出蚊虫侵害数据时间序列季
                                                                            0.2
                节效应较明显,而长期趋势不明显。
                                                                            0.0
                   6
                 原始数据  4 2                                                PACF  -0.2


                   0                                     2.0
                                                             季节成分          -0.1
                                                         1.0
                                                         0.0                     0.2  0.4  0.6  0.8  1.0  1.2
                                                        -1.0                                滞后
                  1.6
                 趋势成分  1.2                                        图2   经1阶和1次季节差分后时间序列自相关图和偏自相
                  0.8
                  0.4                                                  关图
                                                         2
                                                         1   剩余误差
                                                         0            模型诊断:对 ARIMA(2,1,0)(1,1,0) 12 进行
                                                        -1
                                                                  Ljung⁃Box残差检测,可以认为该模型残差序列不存
                     2015    2016    2017   2018    2019
                                                                                          2
                                     年份                           在自相关,为白噪声序列(χ =0.079,P=0.778)。
                    图1   2015年1月—2018年12月时间序列分解图                      模型预测:用forecast函数预测2019年1—12月
   110   111   112   113   114   115   116   117   118   119   120