Page 115 - 南京医科大学学报自然科学版
P. 115
第42卷第1期 孙燕群,张守刚,陆墨原,等. 基于SARIMA模型的南京地区蚊虫侵害的预测研究[J].
2022年1月 南京医科大学学报(自然科学版),2022,42(01):108-111 ·109 ·
进行判断。 2.2 SARIMA模型构建
1.2.4 模型构建 2.2.1 模型准备阶段
SARIMA 是ARIMA 中的一种,主要分为季节乘 经 Box⁃Pierce 函数进行检验,序列为非白噪
积和季节相加两种,以季节乘积为多,主要处理序 声序列(P < 0.01),经 ADF 检验不平稳(Dickey⁃
列的季节效应、长期趋势效应和随机波动之间存在 Fuller=-2.275,P=0.466),后经一阶差分后ADF检验
复杂的交互影响关系。SARIMA 乘积模型公式为: 平稳(Dickey⁃Fuller=-3.853,P < 0.05)。
d
D
ΦP (B)φ(B)∇ ∇ =δ+ΘQ (B)θ(B)wt,也可以简化 2.2.2 SARIMA模型预测
S
S
xt
S
为SARIMA(p,d,q)×(P,D,Q)s,其中,p、d、q分别表 参数判断:分别对 2 次差分绘制自相关函数
示短期相关模型的自回归、趋势差分、移动平均的 (auto correlation function,ACF)图和偏自相关函数
阶数,P、D、Q 分别表示季节趋势的自回归、趋势差 (partial ACF,PACF)图,差分后的ACF图和PACF图
分、移动平均的阶数,s 表示周期时间间隔。使用 见图 2。1 阶差分的自相关图非截尾,q 考虑取 0,
Box.test 中的 Ljung⁃Box 函数进行残差白噪声检验。 偏自相关图为 2 阶截尾,p 考虑可取 1 和 2;季节差
经过残差诊断合格后可以对模型进行预测。 分之后的自相关图呈现显著非零,Q 考虑取 0,偏自
1.2.5 模型评价 相关图在 lag12 处有 spike,P 考虑取 1。利用可能的
选择平均误差(mean error,MSE)、均方根误差 参数,分别建立 ARIMA(1,1,0)(1,1,0) 12或者 ARI⁃
(root mean squared error,RMSE)、平 均 绝 对 误 差 MA(2,1,0)(1,1,0) 12 模型,计算最小信息量准则
(mean absolute error,MAE)、平 均 绝 对 比 例 误 差 (AIC)值,其中前者 AIC=114.57,后者 AIC=113.54,
(mean absolute sacled error,MASE)和决定系数 R 进 综合考虑ARIMA(2,1,0)(1,1,0) 12模型。
2
行模型拟合效果的评价。
1.0
1.3 统计学方法
0.8
研究人员将蚊密度按照时间 2015 年 1 月—
0.6
2019年12月进行整理,用Excel2013进行汇总,建立 0.4
时间序列,利用 R x64 4.0.3 软件及下载的 forecast、 ACF
0.2
tseries包进行统计学分析,P < 0.05为差异有统计学
0.0
意义。
-0.2
2 结 果 -0.4
0 0.2 0.4 0.6 0.8 1.0 1.2
2.1 序列概况 滞后
绘制 2015—2018 年蚊虫侵害数据的时间序列
分解图(图 1),可以看出蚊虫侵害数据时间序列季
0.2
节效应较明显,而长期趋势不明显。
0.0
6
原始数据 4 2 PACF -0.2
0 2.0
季节成分 -0.1
1.0
0.0 0.2 0.4 0.6 0.8 1.0 1.2
-1.0 滞后
1.6
趋势成分 1.2 图2 经1阶和1次季节差分后时间序列自相关图和偏自相
0.8
0.4 关图
2
1 剩余误差
0 模型诊断:对 ARIMA(2,1,0)(1,1,0) 12 进行
-1
Ljung⁃Box残差检测,可以认为该模型残差序列不存
2015 2016 2017 2018 2019
2
年份 在自相关,为白噪声序列(χ =0.079,P=0.778)。
图1 2015年1月—2018年12月时间序列分解图 模型预测:用forecast函数预测2019年1—12月