Page 54 - 南京医科大学学报自然科学版
P. 54

第43卷第5期
               ·636 ·                            南 京    医 科 大 学 学         报                        2023年5月


              pyradiomics.readthedocs.io/en/latest/官网可获得。       没有统计学意义(P>0.05,表1)。
              1.2.4 影像特征筛选与降维
                                                                      表1 患者基本临床信息与Ki67指数的关系
                  通过 pyradiomics 模块获取的影像特征并非都
                                                                 Table 1  Relation between patient basic clinical informa⁃
              与患者病理结果Ki67具有相关性,同时考虑提取数                                   tion and the Ki67 index
              据变量存在差异性,先将经病理结果证实的 Ki67≤
                                                                                 Ki67≤10   Ki67>10
              10设立影像组学标签“0”,将病理证实的Ki67>10设                            变量         (n=50)    (n=63)   t/χ 值  P值
                                                                                                      2
              立影像组学标签“1”,然后将所有数据集进行归一                             年龄(岁)         50.7 ± 13.7 52.9 ± 13.0 0.905  0.367
              化处理,再将标准化的数据进行 t 检验剔除两组数                            性别[n(%)]                          0.112  0.849
              据间无统计学意义特征,最后通过最小绝对收缩与                               男             27(54.0)  36(57.1)
              选择算子Lasso算法,同时进行10次交叉验证,最终                           女             23(46.0)  27(42.9)
              引入最优惩罚系数λ,对沉余量进行惩罚,逐步将不                             高血压史[n(%)]                        0.186  0.686
                                                                   是             14(28.0)  20(31.7)
              重要参数压缩至0,降低自变量维度,从而进一步筛
                                                                   否             36(72.0)  43(68.3)
              选出具有显著意义的影像特征。
                                                                  癫痫史[n(%)]                         2.517  0.173
              1.2.5 影像组学模型训练与验证
                                                                   是             10(20.0)   6(9.5)
                  影像组学联合机器学习模型的建立基于Python                          否             40(80.0)  57(90.5)
             (3.7.0)和机器学习库 sklearn等导入实现,通过将数
              据集以8∶2拆分为训练集与测试集。将筛选后的数                           2.2 特征筛选结果
              据进行交叉验证,网格搜索获取最优 C 值与 gamma                            2 名神经外科医师提取的 ROI 影像特征 ICC>
              值等优化参数,再通过支持向量机学习算法进行训                            0.75,表明 2 名医师提取 ROI 具有较高的组间一致
              练并建立相应的影像组学模型,测试集数据用于对                            性。将所有数据集通过 t 检验共筛选出 608 个具有
              训练好的模型进行验证,最后结果以准确度、灵敏                            差异性影像特征,选择Lasso回归,利用10次交叉验
              度、特异度和受试者操作特征(receiver operat char⁃               证中最优的λ选择系数非零的最佳影像组学特征
              acterist,ROC)曲 线 下 面 积(area under the curve,      (图 1A),根据影像组学特征的 Lasso 系数分布(图
              AUC)表示。                                           1B),绘制最佳特征与权重图(图 1C),同时将 Lasso
              1.3  统计学方法                                        回归筛选出6个特征进行组间差异分析并绘制热度
                  本研究采样 SPSS 软件进行相关统计学分析。                       图(图1D)。
              使用卡方检验和独立样本t检验分析胶质瘤患者高                            2.3  模型训练与预测结果
              表达 Ki67 与低表达 Ki67 组年龄、性别、是否合并高                         通 过 交 叉 网 格 搜 索 得 到 C 为 0.5、gamma 为
              血压和是否诱发癫痫组间差异是否具有统计学意                             0.062 5,将最佳影像组学特征通过SVM算法建立胶
              义,P<0.05 为差异具有统计学意义。采样组间相                         质瘤Ki67级别预测模型,应用 ROC 曲线分析模型,
              关系数(inter classcorrelation coefficient,ICC)评估 2   在训练集中的AUC 值、灵敏度、特异度、准确度分别
              名神经医师各自获取病灶ROL影像特征的一致性,                           为0.82、0.71、0.79、0.72,在测试集中AUC 值、灵敏度、
              ICC>0.75 被认为一致性良好         [16] 。用 ROC 曲线与模        特异度、准确度分别为0.91、0.88、0.88、0.83(图2)。
              型校准曲线评估模型区分效能,评估指标为AUC与                           2.4  建立模型校准曲线
              布里尔得分(Brier score)        ,分数越高预测结果越                   为进一步验证预测概率与实际概率之间是否
                                    [18-19]
              差,分数越低模型预测能力越好。                                   较大偏倚,利用预测模型校准曲线对结果进行分
                                                                析 [20-21] 。图3可示实线代表的校准线与理想模型代
              2  结 果
                                                                表的对角虚线存在一定偏差,但较接近吻合,布里
              2.1  患者基本临床信息与Ki67指数的关系                           尔得分0.175。
                  本研究共纳入的 113 例胶质瘤患者中 Ki67≤10
                                                                3  讨 论
              共 50 例(男 27 例,女 23 例),平均年龄(50.7±13.7)
              岁,Ki67>10 共 63 例(男 36 例,女 27 例),平均年龄                   胶质瘤是中枢神经系统占比最多、恶性程度最
             (52.9 ± 13.0)岁 。 结 果 发 现 胶 质 瘤 Ki67≤10 和           高、预后最差的肿瘤          [22-23] ,患者常存在明显的异质
              Ki67>10之间的年龄、性别、高血压史、癫痫史差异                        性,手术联合术后放化疗仍是主要治疗策略。胶质
   49   50   51   52   53   54   55   56   57   58   59