Page 79 - 南京医科大学学报自然科学版
P. 79

第44卷第1期             马一鸣,丁 勇. 我国2012―2021年4种肝炎流行趋势的时间序列分析和预测[J].
                  2024年1月                     南京医科大学学报(自然科学版),2024,44(01):072-079                       · 73  ·


                    病毒性肝炎(简称肝炎,hepatitis)可分为甲型                    的模型,并利用这个模型来预测未来的数据变化                     [8-9] 。
               (hepatitis A)、乙型(hepatitis B)、丙型(hepatitis C)、     季节 ARIMA 模型适用于由于季节性变化(包括季
                丁型(hepatitis D)和戊型(hepatitis E),在没有及时             度、月度等)或其他一些因素引起的周期性变化的
                的救治与干预情况下会进一步发展为肝硬化、肝衰                            时间序列。
                竭以及肝癌     [1-2] ,甚至导致死亡。我国是肝炎高发国                      ES 模型是一种特殊的加权移动平均法 ,其特
                                                                                                         [5]
                家,近年来,我国在病毒性肝炎防治方面取得巨大                            点是以无穷大为宽度,各历史值的权重随时间的推
                成就,但由于人口众多,肝炎感染者的基数大、病情                           移呈指数衰减,从而给近期的观察值较大的权数,
                长久、医治负担沉重等因素,肝炎防治仍然任重道远,                          给远期的观察值以较小的权数,用当前值和历史值
                因此,肝炎的早发现、早治疗、早干预意义重大                    [3-4] 。  来预测未来值。季节 ES 模型适用于有季节性趋势
                分析传染病流行的特征和规律,及早做出预测是对                            的时间序列。
                疾病未来发生、发展趋势认知的重要手段,是制定                                两种模型都用SPSS 27 统计软件完成计算。最
                传染病防控策略的重要前提。                                     优模型用SPSS提供的如下指标进行评价筛选                   [10] :平
                    时间序列分析方法能对一定时间段的连续                            稳R 和R ,这2个指标值越大,说明模型拟合效果越
                                                                          2
                                                                      2
                性观测数据进行相关特征地提取并分析其变化                              好;平均绝对误差百分比,即相对误差绝对值的平
                过程与发展规律,被广泛用于社会各个领域                      [5-7] 。  均值(mean absolute percentage error,MAPE),指标值
                本文通过时间序列分析我国 4 种肝炎(甲型、乙型、                         越小,说明模型拟合的误差越小;贝叶斯信息准则
                丙型和戊型)近10年(2012―2021年)流行的周期性                      BIC(Bayesian information criterion),这个指标值越
                特征和长期变化趋势,并探讨季节自回归移动平均                            小,说明模型对数据的解释力越强,模型越好。
                模型(autoregressive integrated moving average model,    两个模型 A、B 的筛选:对指标值较大为优者,
                ARIMA)和季节指数平滑模型(exponential smoothing                                      IA-IB
                model,ES)在肝炎发病预测中的应用和预测效果比                        计算指标I的相对差值 Î = IA+IB ,对指标值较小为
                较,发现适合我国肝炎发病分析的时间序列模型,                                                      2
                                                                                                  IA-IB
                为传染病的防控救治工作提供参考依据和建议。                             优者,计算指标 I 的相对差值 Î =- IA+IB 。显然,当

                1 资料和方法                                                                            2
                                                                  Î > 0 时,模型 A 优于模型 B,反之,模型 B 优于模型
                1.1  资料                                           A。对多个指标,综合得到∑Î,当∑Î > 0 时,模型 A
                    数据来自国家卫健委(http://www.nhc.gov.cn)发             优于模型B,反之,模型B优于模型A。
                布的2012年1月—2022年8月全国甲型、乙型、丙型                           对于多个模型,依次进行比较,选择最优模型。
                及戊型肝炎的月发病例数统计资料(目前卫健委发
                                                                  2 结    果
                布的最新数据)。丁型肝炎的月发病例数较少,以
                2021年为例,平均每月发病例数为24.42例,仅为甲                       2.1 流行特征
                肝、乙肝、丙肝、戊肝发病数的 2.36%、0.02%、0.12%                      我国 4 种肝炎 2012—2021 年的月发病例数的
                和 1.09%,由于缺少 2015 年及以前的统计数据,未                     描述统计(表 1)显示,肝炎发病例数最多的时间集
                纳入本次研究范围。                                         中在 2019 年之前,发病例数最少的时间集中在
                1.2  方法                                           2019 年以后,由此可见,近年来我国肝炎的防治工
                    对 2012 年 1 月—2021 年 12 月数据进行时间序               作卓有成效;月发病例数最大值与最小值的比值为
                列的季节性分解,探讨10年来我国4种肝炎流行特                           1.26~3.67;以甲型肝炎平均月发病例数为基数1,乙
                征和长期趋势。由于肝炎发病有一定的季节性规                             型、丙型、戊型肝炎分布是甲型肝炎的57.06、11.50、
                律,本文用季节 ARIMA 模型和季节 ES 模型分别对                      1.35倍,说明乙型肝炎和丙型肝炎发病人数众多(平
                4种肝炎进行建模与预测,其中2012年1月—2021年                       均月发病例数分别接近 10 万和 2 万),是我国肝炎
                12 月的 10 年数据用于建立模型,2022 年 1―8 月数                  人群的防控重点。
                据用于预测,并对预测的效果进行评价与比较。                                 图1为我国4种肝炎的月发病例数10年时间的
                    ARIMA模型是通过时间序列数据的自回归、移                        序列图,既有长期上升或下降的趋势,也有每年的
                动平均和差分等变换,建立一个能够描述数据特征                            周期性波动,为了更清晰地探讨这些变化规律,将
   74   75   76   77   78   79   80   81   82   83   84