Page 79 - 南京医科大学学报自然科学版
P. 79
第44卷第1期 马一鸣,丁 勇. 我国2012―2021年4种肝炎流行趋势的时间序列分析和预测[J].
2024年1月 南京医科大学学报(自然科学版),2024,44(01):072-079 · 73 ·
病毒性肝炎(简称肝炎,hepatitis)可分为甲型 的模型,并利用这个模型来预测未来的数据变化 [8-9] 。
(hepatitis A)、乙型(hepatitis B)、丙型(hepatitis C)、 季节 ARIMA 模型适用于由于季节性变化(包括季
丁型(hepatitis D)和戊型(hepatitis E),在没有及时 度、月度等)或其他一些因素引起的周期性变化的
的救治与干预情况下会进一步发展为肝硬化、肝衰 时间序列。
竭以及肝癌 [1-2] ,甚至导致死亡。我国是肝炎高发国 ES 模型是一种特殊的加权移动平均法 ,其特
[5]
家,近年来,我国在病毒性肝炎防治方面取得巨大 点是以无穷大为宽度,各历史值的权重随时间的推
成就,但由于人口众多,肝炎感染者的基数大、病情 移呈指数衰减,从而给近期的观察值较大的权数,
长久、医治负担沉重等因素,肝炎防治仍然任重道远, 给远期的观察值以较小的权数,用当前值和历史值
因此,肝炎的早发现、早治疗、早干预意义重大 [3-4] 。 来预测未来值。季节 ES 模型适用于有季节性趋势
分析传染病流行的特征和规律,及早做出预测是对 的时间序列。
疾病未来发生、发展趋势认知的重要手段,是制定 两种模型都用SPSS 27 统计软件完成计算。最
传染病防控策略的重要前提。 优模型用SPSS提供的如下指标进行评价筛选 [10] :平
时间序列分析方法能对一定时间段的连续 稳R 和R ,这2个指标值越大,说明模型拟合效果越
2
2
性观测数据进行相关特征地提取并分析其变化 好;平均绝对误差百分比,即相对误差绝对值的平
过程与发展规律,被广泛用于社会各个领域 [5-7] 。 均值(mean absolute percentage error,MAPE),指标值
本文通过时间序列分析我国 4 种肝炎(甲型、乙型、 越小,说明模型拟合的误差越小;贝叶斯信息准则
丙型和戊型)近10年(2012―2021年)流行的周期性 BIC(Bayesian information criterion),这个指标值越
特征和长期变化趋势,并探讨季节自回归移动平均 小,说明模型对数据的解释力越强,模型越好。
模型(autoregressive integrated moving average model, 两个模型 A、B 的筛选:对指标值较大为优者,
ARIMA)和季节指数平滑模型(exponential smoothing IA-IB
model,ES)在肝炎发病预测中的应用和预测效果比 计算指标I的相对差值 Î = IA+IB ,对指标值较小为
较,发现适合我国肝炎发病分析的时间序列模型, 2
IA-IB
为传染病的防控救治工作提供参考依据和建议。 优者,计算指标 I 的相对差值 Î =- IA+IB 。显然,当
1 资料和方法 2
Î > 0 时,模型 A 优于模型 B,反之,模型 B 优于模型
1.1 资料 A。对多个指标,综合得到∑Î,当∑Î > 0 时,模型 A
数据来自国家卫健委(http://www.nhc.gov.cn)发 优于模型B,反之,模型B优于模型A。
布的2012年1月—2022年8月全国甲型、乙型、丙型 对于多个模型,依次进行比较,选择最优模型。
及戊型肝炎的月发病例数统计资料(目前卫健委发
2 结 果
布的最新数据)。丁型肝炎的月发病例数较少,以
2021年为例,平均每月发病例数为24.42例,仅为甲 2.1 流行特征
肝、乙肝、丙肝、戊肝发病数的 2.36%、0.02%、0.12% 我国 4 种肝炎 2012—2021 年的月发病例数的
和 1.09%,由于缺少 2015 年及以前的统计数据,未 描述统计(表 1)显示,肝炎发病例数最多的时间集
纳入本次研究范围。 中在 2019 年之前,发病例数最少的时间集中在
1.2 方法 2019 年以后,由此可见,近年来我国肝炎的防治工
对 2012 年 1 月—2021 年 12 月数据进行时间序 作卓有成效;月发病例数最大值与最小值的比值为
列的季节性分解,探讨10年来我国4种肝炎流行特 1.26~3.67;以甲型肝炎平均月发病例数为基数1,乙
征和长期趋势。由于肝炎发病有一定的季节性规 型、丙型、戊型肝炎分布是甲型肝炎的57.06、11.50、
律,本文用季节 ARIMA 模型和季节 ES 模型分别对 1.35倍,说明乙型肝炎和丙型肝炎发病人数众多(平
4种肝炎进行建模与预测,其中2012年1月—2021年 均月发病例数分别接近 10 万和 2 万),是我国肝炎
12 月的 10 年数据用于建立模型,2022 年 1―8 月数 人群的防控重点。
据用于预测,并对预测的效果进行评价与比较。 图1为我国4种肝炎的月发病例数10年时间的
ARIMA模型是通过时间序列数据的自回归、移 序列图,既有长期上升或下降的趋势,也有每年的
动平均和差分等变换,建立一个能够描述数据特征 周期性波动,为了更清晰地探讨这些变化规律,将