Page 103 - 南京医科大学学报自然科学版
P. 103
第43卷第9期 林 洁,苏春秋,唐文天,等. 基于T1WI增强影像组学在鉴别高级别胶质瘤复发与假性进展中
2023年9月 的应用价值[J]. 南京医科大学学报(自然科学版),2023,43(9):1279-1284 ·1281 ·
com/salan668/FAE)对每例 T1WI 增强图像的 VOI 提 分为训练组(72例)和验证组(32例),同时导入临床
取 1 648 个特征,包括:①形状特征;②一阶直方图 特征以确保随机分类的组间具有相同临床特征的
特征;③二阶纹理特征:包括灰度共生矩阵、灰度游 分布。影像组学流程图如图1所示。
程矩阵、灰度大小区域矩阵、邻域灰度差矩阵及灰 1.2.4 特征处理
度依赖矩阵;④高阶特征:包括对以上特征进行小 为了避免不同采集参数产生的偏倚,使用 Z⁃
波变换等高阶变换。将所有病例以7∶3的比例随机 score 方法将所有的特征进行标准化。通过主成分
一阶特征 二阶特征
形状特征 小波变换特征
感兴趣区勾画 特征提取 特征处理与筛选 模型构建与评价
在轴位T1WI增强图像上手工分割感兴趣区并提取影像组学特征,包括形状特征、一阶特征、二阶特征和小波变换特征。采用PCA降维、
LASSO对特征进行筛选。预测模型的性能通过校准曲线、AUC进行评估。
图1 影像组学分析流程图
分析(principal component analysis,PCA)进一步数据 验进行比较。P < 0.05为差异有统计学意义。绘制
降维,将潜在相关的高维特征转变为线性独立的低维 校准曲线,计算准确度、灵敏性、特异度和AUC以评
特征。最后,采用最小绝对收缩和选择算子(least 估模型性能。
absolute shrinkage and selection operator,LASSO)来选
2 结 果
择具有非零系数的最优特征。
1.2.5 模型建立与效能评价 2.1 临床影像资料
支持向量机(support vector machine,SVM)建立 患者临床影像资料见表 1,假性进展组的年龄
组学模型,为了尽可能避免偏差和过拟合,采用5倍 为(49.281±11.627)岁,复发组的年龄为(55.457±
交叉验证法对模型进行检验。并绘制模型训练组 10.428)岁,差异有统计学意义(P < 0.05)。假性进
和验证组的受试者工作特征(receiver operating char⁃ 展组与复发组的性别、肿瘤定位、肿瘤中心部位、颞
acteristic,ROC)曲线,计算曲线下面积(area under 肌厚度、最大强化面积及水肿带最大面积差异均无
curve,AUC)、准确率、灵敏度、特异度。绘制校准曲 统计学意义(P均>0.05)。
线验证模型效能。 2.2 特征筛选
1.3 统计学方法 将 1 648 个特征进行 PCA 降维,获得 64 个 PCA
使用SPSS 23.0软件及Python 3.0软件进行统计 特征,然后通过 LASSO 筛选获得 13 个非零特征,随
分析。首先对计量资料包括年龄、颞肌厚度、最大 着λ逐渐变大,越来越多的特征系数被压缩为0,在最
强化面积、水肿带最大面积进行Kolmogorov⁃Smirnov 优λ值时只剩13个非零特征。因此,最终获得13个最
正态性检验和Levene方差齐性检验,符合正态分布 佳PCA特征用于建模(图2)。
的计量资料用均数±标准差(x ± s)表示,采用独立样 2.3 影像组学模型及效能评价
本 t 检验;不符合正态分布者以中位数(四分位数) 使用最终获得的 13 个 PCA 特征建立 SVM 组
[M(P25,P75 )]表示,采用非参数 Mann⁃Whitney U 检 学模型,利用 ROC 曲线来评估组学模型的诊断效
验进行比较。对于分类资料包括性别、肿瘤定位、 能(图 3)。校准曲线分析模型校准效能(图 4)。训
肿瘤中心部位,用频数(百分比)表示,采用卡方检 练组鉴别 HGG 复发与假性进展的 AUC 为 0.929,准