Page 86 - 南京医科大学学报自然科学版
P. 86

第44卷第3期
               ·376 ·                          南   京 医 科       大 学      学 报                        2024年3月


              法筛选出的 HCR 和 DTL 特征数量如表 1 所示。随                     并对11种多序列的最优实验结果进行整理,结果显
              后,分别采用mRMR、SVM⁃RFE、RF⁃RFE 3种筛选方                   示,使用 T2+T1c+Flair 序列组合,且基于 SVM⁃RFE
              法对上述筛选出的特征进一步选出排名前 10 的特                          的特征筛选方法和 SVM 分类器的模型获得最好的
              征(表1)。15种影像序列融合方式中,每种序列融合                         预测效果(图 4A、B):在验证集上,AUC 达到 0.996
              方式均包含 3 种筛选方法下的 3 种特征组合方式,                        (95%CI:0.991~1.000),YI、ACC、SEN、SPE 分别为
              即 9 个特征子集,最终生成135种特征融合子集。                         0.920、0.976、0.988 和 0.932。五折交叉验证结果显
              2.2  脑胶质瘤分级模型的构建和比较                               示该模型具有较高的稳定性(图4C)。
              2.2.1 单序列分析                                       2.2.3 模型验证
                  本研究主要包括 4 个序列(15 种序列融合方                            使用 30 例未参与训练的测试数据集进行最终
              式)、3 种特征和 3 种特征筛选方法,因此对上述这                        模型分类效能的验证。在测试集上,AUC值为0.986
              135 个特征融合子集分别通过 7 种 ML 分类器进行                      (图4D)、ACC为0.921、SEN为0.933、SPE为 0.875。
              建模。此外还对 HCR、DTL 和 DLR 这 3 种特征提取                   2.3  模型临床获益和可解释性
              方法进行比较,4 个单序列数据集的性能分析结果                                使用SHAP算法获得各序列的每个DLR预测特
              显示,在4个序列中,与HCR和DTL相比,DLR作为                        征的权重,并按重要性排序列出前 20 的特征。
              输入特征建模时,实验结果更具有竞争力(表2)。                           SHAP 值表示每个特征对最终预测的贡献,Flair 序
              2.2.2 多序列分析                                       列的特征贡献较大,其次为T2及T1c序列(图5);同
                  单序列分析结果显示,基于 DLR 特征构建的                        时,排名前20的特征中,HCR和DTL特征均有贡献。
              ML 模型具有较高的分级预测效能,因此在多序列
                                                                3  讨 论
              建模中使用 DLR 特征集进行后续实验分析。对各
              模型特征筛选方法和分类器的预测性能进行比较,                                 由于侵袭性和浸润性不同,脑胶质瘤的分级直


                                                      表1 特征筛选结果
                                               Table 1  Results of the selected features                 (n)

                                         T1                 T2                 T1c                Flair
                  Selected methods
                                    HCR      DTL       HCR       DTL      HCR       DTL      HCR       DTL
                  Original features  1 321   1 000     1 321    1 000     1 321    1 000     1 321    1 000
                  Spearman           469      906       392      915       358       861      495       934
                  mRMR                10       10        10       10        10       10        10       10
                  RF⁃RFE              10       10        10       10        10       10        10       10
                  SVM⁃RFE             10       10        10       10        10       10        10       10

                                                 表2 单序列验证集实验结果汇总
                                       Table 2 The summary of single sequence in verification sets
                Sequence  Feature classification  Feature screening and classifier  AUC(95%CI)  ACC  SEN  SPE  YI
                T1             HCR               SVM⁃RFE+LR         0.963(0.927-0.99)  0.921  0.950  0.825  0.775
                               DTL               RF⁃RFE+RF          0.700(0.635-0.765)  0.767  0.950  0.724  0.674
                               DLR               SVM⁃RFE+LR         0.980(0.968-0.993)  0.925  0.961  0.797  0.758
                T2             HCR             SVM⁃RFE+XGBoost      0.968(0.933-0.997)  0.922  0.946  0.838  0.784
                               DTL             RF⁃RFE+XGBoost       0.815(0.764-0.866)  0.780  0.903  0.744  0.647
                               DLR              SVM⁃RFE+SVM         0.971(0.949-0.993)  0.928  0.969  0.784  0.753
                T1c            HCR              SVM⁃RFE+SVM         0.971(0.934-1.000)  0.927  0.957  0.825  0.782
                               DTL               RF⁃RFE+RF          0.836(0.757-0.912)  0.816  0.961  0.703  0.664
                               DLR              SVM⁃RFE+SVM         0.973(0.949-0.997)  0.937  0.977  0.797  0.774
                Flair          HCR               SVM⁃RFE+LR         0.979(0.959-0.998)  0.937  0.977  0.797  0.774
                               DTL               RF⁃RFE+NB          0.737(0.668-0.807)  0.761  0.891  0.703  0.594
                               DLR               SVM⁃RFE+LR         0.978(0.953-0.998)  0.943  0.981  0.811  0.792
   81   82   83   84   85   86   87   88   89   90   91