Page 79 - 南京医科大学自然版
P. 79
第44卷第7期 王 皓,杜昱升,王 友,等. 基于光谱CT和影像组学特征的机器学习模型和列线图预测甲
2024年7月 状腺结节良恶性[J]. 南京医科大学学报(自然科学版),2024,44(7):958-965 ·963 ·
A B
NIC NIC
Radscore Radscore
Feature value
Age age High
FT3 FT3
λHu λHu Low
FT4 FT4
Sex Sex
0 0.5 1.0 1.5 2.0 -3 -2 -1 0 1 2 3
Mean(|SHAP value|) SHAP value
A:XGBoost model importance gain chart. B:XGBoost SHAP summary plot. The variables were sorted from top to bottom,and it can be observed
that NIC,Radscore,age,λHu,and FT3 are the top 5 influential features in the model.
图3 XGBoost模型变量重要性图与SHAP简要图
Figure 3 Importance plot and SHAP summary plot of XGBoost model
表3 XGBoost算法变量重要影响因素逻辑回归
Table 3 XGBoost algorithm⁃variable importance factors for logistic regression
Univariate analysis Multivariate analysis
Characteristic
OR 95% CI Z P OR 95% CI Z P
NIC 0.100 0.042-0.200 -5.885 < 0.001 0.099 0.032-0.233 -4.662 < 0.001
Radscore 4.573 2.853-8.013 5.809 < 0.001 4.918 2.609-10.810 4.442 < 0.001
Age 0.954 0.926-0.981 -3.193 < 0.001 0.946 0.902-0.987 -2.465 0.014
0.813 0.513-1.135 -1.045 0.296 - - - -
λHu
FT3 1.061 0.764-1.485 0.355 0.722 - - - -
测,进一步构建的列线图也展示了良好的预测能力 影像组学通过对医学图像进行高通量的定量
和临床实用性。 特征分析,能够揭示传统影像学中无法发现的图像
光谱 CT 采用稀有金属钇和稀土陶瓷材质的双 特征,有助于建立诊断预测模型,为个体精准医疗
层探测器结构,在不更改常规扫描流程的同时可以 提供有利的条件 [20] 。已有研究表明影像组学在预
获取能谱信息如碘密度图、能谱曲线等 [15] 。本研究 测甲状腺结节良恶性方面具有一定潜力,Park 等 [21]
发现恶性甲状腺结节的 NIC 显著低于良性结节,与 使用超声图像的影像组学特征进行分类得出的
先前的研究结果一致 [16] 。良性甲状腺结节测量出 AUC为0.75,武欣欣等 [22] 结合CT的平扫与增强特征
了较高的碘值,其原因主要是它们在组织结构上保 及临床数据得到了更好的AUC为0.793。本研究运
留了正常甲状腺细胞的功能和更加丰富的血管供 用了差异性比较、组间一致性评估与 LASSO 的方
给,增强了碘造影剂的输送和积累 [17] 。与此相对, 法,最终筛选出了与良恶性相关的 3 个一阶特征与
恶性甲状腺结节内部的纤维化、坏死或钙化以及更 3 个 纹 理 特 征 。 其 中 ,一 阶 特 征 10Percentile 与
多的异常紊乱血管导致血流量下降,表现出碘值的 90Percentile 表示直方图灰度强度的分布,Minimum
降低 [18] 。本研究还发现,年龄是甲状腺恶性结节的 则表示为图像的最小像素值,GLSZM、NGTDM 与
预测风险因素。其原因可能与激素水平异常相关, GLCM 主要提供纹理的变化和细节丰富度的信息,
特别是女性青春期与孕期的雌激素和孕激素波动, 上述特征表明良性与恶性结节在不同维度上的异
这些激素的显著变化可影响甲状腺细胞受体或模 质性 [23] 。为了提升ML预测效能,本研究比较了6种
拟TSH的活性来改变甲状腺功能,进而促进甲状腺 不同的 ML 算法,发现 XGBoost 表现最优,在验证集
癌的发展 [19] 。此外,青年人群健康意识的提升及甲 中的 AUC 达到了 0.938。XGBoost 是一种高效准确
状腺超声检查的广泛应用,也可能是甲状腺结节检 的集成学习方法,通过梯度提升和极端情况下的处
出率提高的原因之一。 理能力,能优化多个决策树以逐步减小模型的预测