Page 76 - 南京医科大学学报自然科学版
P. 76

第42卷第4期
               ·526 ·                            南 京    医 科 大 学 学         报                        2022年4月


                                   表3 基于二分类Logistic回归模型进行两两分类预测的评价指标比较
                               Table 3 Binary classification evaluation for 5 models based on logistic regression
                 模型                       准确率(%)         查准率(%)         召回率(%)        F1得分(%)       AUC(%)

                            AD vs. NC     0089.42       0086.45        0083.27       0004.77        0094.13
                 模型1        MCI vs. NC    0067.22       0070.14        0080.05       0074.73        0072.24
                            MCI vs. AD    0077.62       0060.13        0037.86       0046.32        0079.85
                            AD vs. NC     0081.14       0077.45        0081.95       0079.55        0089.25
                 模型2        MCI vs. NC    0067.47       0071.19        0085.55       0077.68        0069.40
                            MCI vs. AD    0071.67       0054.49        0021.30       0030.48        0073.48
                            AD vs. NC     0099.53       0099.62        0099.03       0099.32        0099.99
                 模型3        MCI vs. NC    0076.37       0080.91        0079.99       0080.42        0084.80
                            MCI vs. AD    0089.85       0084.32        0074.20       0078.83        0096.07
                            AD vs. NC     0092.35       0091.80        0089.57       0090.61        0097.49
                 模型4        MCI vs. NC    0071.98       0076.04        0084.78       0080.13        0078.30
                            MCI vs. AD    0078.67       0064.48        0047.56       0054.44        0083.63
                            AD vs. NC     0100.00       0100.00        0100.00       0100.00        0100.00
                 模型5        MCI vs. NC    0077.18       0082.39        0083.51       0082.91        0085.52
                            MCI vs. AD    0089.58       0083.69        0075.71       0079.39        0096.39


                                         表4 多分类Logistic回归同时分类预测评价指标比较
                          Table 4 Simultaneous classification evaluation for 5 models based on multinomial regression
                                     准确率(%)                 查准率      召回率     F1得分             AUC(%)
                模型
                         合计       NC组     MCI组      AD组      (%)     (%)     (%)      NC组     MCI组      AD组
                模型1      55.66    45.33    68.85    38.32    50.83   56.32    57.51   77.16    59.20    84.37
                模型2      53.26    31.52    76.74    22.98    43.74   52.37    55.05   74.94    55.24    78.98
                模型3      72.53    69.64    74.13    73.62    72.46   74.42    71.73   88.30    81.00    97.26
                模型4      59.45    46.86    70.69    47.26    54.93   59.06    60.42   81.92    63.67    85.96
                模型5      70.69    58.44    75.68    75.93    70.02   71.77    69.00   87.95    79.78    96.87


              量表联合模型的总体准确率比影像模型提高了                              (246例)和 MCI 未转化成AD(106例)共计352例样
              16.87%;正确分类为 NC 组、MCI 组和 AD 组的比例                  本,基本社会人口学特征如表2。我们使用表1中相
              分别提高了 24.31%、5.27%和 35.30%;查准率、召                  同的社会人口学特征和生物标志 ApoE4 基因型作
              回 率 和 综 合 指 标 F1 得 分 分 别 提 高 了 21.63% 、           为不随时间变化的协变量。图像特征相关的7个变
              18.10% 和 14.22% ;AUC 分 别 提 高 了 11.14% 、           量(脑室容积、全脑容积、海马、内嗅皮质、梭状回、
              21.80%和 12.89%,特别是区分 AD 与其他两类的                    颞中回和脑容量)、其他 3 个生物标志(Abeta、Tau、
              AUC 达到了 97.58%。表 4 中不同模型下各个评价                     p⁃Tau);MMSE 和 ADAS⁃Cog13 两 个 量 表 得 分 共
              指标表明基于多分类 Logistic 回归模型,增加传统                      12 个变量则计算个体从MCI状态首次转化到AD的
              的神经认知量表数据对分类效果有很大提升,但                             变化量作为协变量加入到Logistic回归模型中。
              增加生物标志测量数据对于提高分类准确率的作                                  本文随机产生 100 个数据集,每一个数据集中
              用有限。另外,表 4 影像量表生物标志三联合模型                          随机抽取 70%样本作为训练集,余下 30%样本作为
              的结果表明,并非将所有来源的数据加入 AD 疾病                          预测集,计算准确率、召回率、查准率、F1 得分和
              发展状态的分类预测中会得到最好的分类效果,                             AUC值作为评价模型的准则。表5为使用不同来源

              变量之间存在的共线性可能会降低多分类 Logistic                       数据模型分类预测的指标100次数据随机划分结果
              的评价效果。                                            的平均值。从表5可以看出,整合脑图像数据、神经
              2.2  MCI疾病状态转化成AD的分类预测                            认知量表以及生物标志数据能提高转化状态分类

                  本文从 ADNI 数据中筛选了 MCI 转化成 AD                    预测的准确率。在5个模型中脑图像数据结合神经
   71   72   73   74   75   76   77   78   79   80   81