Page 103 - 南京医科大学学报自然科学版
P. 103

第43卷第9期        林   洁,苏春秋,唐文天,等. 基于T1WI增强影像组学在鉴别高级别胶质瘤复发与假性进展中
                  2023年9月              的应用价值[J]. 南京医科大学学报(自然科学版),2023,43(9):1279-1284                   ·1281 ·


                com/salan668/FAE)对每例 T1WI 增强图像的 VOI 提             分为训练组(72例)和验证组(32例),同时导入临床
                取 1 648 个特征,包括:①形状特征;②一阶直方图                       特征以确保随机分类的组间具有相同临床特征的
                特征;③二阶纹理特征:包括灰度共生矩阵、灰度游                           分布。影像组学流程图如图1所示。
                程矩阵、灰度大小区域矩阵、邻域灰度差矩阵及灰                            1.2.4 特征处理
                度依赖矩阵;④高阶特征:包括对以上特征进行小                                为了避免不同采集参数产生的偏倚,使用 Z⁃
                波变换等高阶变换。将所有病例以7∶3的比例随机                           score 方法将所有的特征进行标准化。通过主成分



                                      一阶特征          二阶特征






                                      形状特征        小波变换特征







                   感兴趣区勾画                    特征提取                   特征处理与筛选                  模型构建与评价
                   在轴位T1WI增强图像上手工分割感兴趣区并提取影像组学特征,包括形状特征、一阶特征、二阶特征和小波变换特征。采用PCA降维、
                LASSO对特征进行筛选。预测模型的性能通过校准曲线、AUC进行评估。
                                                     图1   影像组学分析流程图


                分析(principal component analysis,PCA)进一步数据         验进行比较。P < 0.05为差异有统计学意义。绘制
                降维,将潜在相关的高维特征转变为线性独立的低维                           校准曲线,计算准确度、灵敏性、特异度和AUC以评
                特征。最后,采用最小绝对收缩和选择算子(least                         估模型性能。
                absolute shrinkage and selection operator,LASSO)来选
                                                                  2  结 果
                择具有非零系数的最优特征。
                1.2.5 模型建立与效能评价                                   2.1  临床影像资料
                    支持向量机(support vector machine,SVM)建立               患者临床影像资料见表 1,假性进展组的年龄
                组学模型,为了尽可能避免偏差和过拟合,采用5倍                           为(49.281±11.627)岁,复发组的年龄为(55.457±
                交叉验证法对模型进行检验。并绘制模型训练组                             10.428)岁,差异有统计学意义(P < 0.05)。假性进
                和验证组的受试者工作特征(receiver operating char⁃             展组与复发组的性别、肿瘤定位、肿瘤中心部位、颞
                acteristic,ROC)曲线,计算曲线下面积(area under              肌厚度、最大强化面积及水肿带最大面积差异均无
                curve,AUC)、准确率、灵敏度、特异度。绘制校准曲                      统计学意义(P均>0.05)。
                线验证模型效能。                                          2.2  特征筛选
                1.3  统计学方法                                            将 1 648 个特征进行 PCA 降维,获得 64 个 PCA
                    使用SPSS 23.0软件及Python 3.0软件进行统计                特征,然后通过 LASSO 筛选获得 13 个非零特征,随
                分析。首先对计量资料包括年龄、颞肌厚度、最大                            着λ逐渐变大,越来越多的特征系数被压缩为0,在最

                强化面积、水肿带最大面积进行Kolmogorov⁃Smirnov                  优λ值时只剩13个非零特征。因此,最终获得13个最
                正态性检验和Levene方差齐性检验,符合正态分布                         佳PCA特征用于建模(图2)。
                的计量资料用均数±标准差(x ± s)表示,采用独立样                       2.3  影像组学模型及效能评价
                本 t 检验;不符合正态分布者以中位数(四分位数)                             使用最终获得的 13 个 PCA 特征建立 SVM 组
               [M(P25,P75 )]表示,采用非参数 Mann⁃Whitney U 检             学模型,利用 ROC 曲线来评估组学模型的诊断效
                验进行比较。对于分类资料包括性别、肿瘤定位、                            能(图 3)。校准曲线分析模型校准效能(图 4)。训
                肿瘤中心部位,用频数(百分比)表示,采用卡方检                           练组鉴别 HGG 复发与假性进展的 AUC 为 0.929,准
   98   99   100   101   102   103   104   105   106   107   108