Page 79 - 南京医科大学自然版
P. 79

第44卷第7期         王 皓,杜昱升,王       友,等. 基于光谱CT和影像组学特征的机器学习模型和列线图预测甲
                  2024年7月              状腺结节良恶性[J]. 南京医科大学学报(自然科学版),2024,44(7):958-965                   ·963 ·


                   A                                              B
                         NIC                                          NIC
                     Radscore                                      Radscore
                                                                                                        Feature value
                         Age                                           age                               High
                         FT3                                          FT3

                         λHu                                           λHu                               Low
                         FT4                                          FT4

                         Sex                                          Sex
                             0      0.5     1.0     1.5    2.0           -3  -2   -1   0    1    2   3
                                    Mean(|SHAP value|)                              SHAP value

                   A:XGBoost model importance gain chart. B:XGBoost SHAP summary plot. The variables were sorted from top to bottom,and it can be observed
                that NIC,Radscore,age,λHu,and FT3 are the top 5 influential features in the model.
                                             图3 XGBoost模型变量重要性图与SHAP简要图
                                    Figure 3 Importance plot and SHAP summary plot of XGBoost model


                                             表3 XGBoost算法变量重要影响因素逻辑回归
                                 Table 3  XGBoost algorithm⁃variable importance factors for logistic regression

                                       Univariate analysis                         Multivariate analysis
                 Characteristic
                                 OR       95% CI       Z         P       OR         95% CI        Z        P
                   NIC          0.100   0.042-0.200  -5.885   < 0.001    0.099    0.032-0.233   -4.662   < 0.001
                   Radscore     4.573   2.853-8.013   5.809   < 0.001    4.918    2.609-10.810   4.442   < 0.001
                   Age          0.954   0.926-0.981  -3.193   < 0.001    0.946    0.902-0.987   -2.465     0.014
                                0.813   0.513-1.135  -1.045     0.296     -           -           -        -
                   λHu
                   FT3          1.061   0.764-1.485   0.355     0.722     -           -           -        -

                测,进一步构建的列线图也展示了良好的预测能力                                影像组学通过对医学图像进行高通量的定量
                和临床实用性。                                           特征分析,能够揭示传统影像学中无法发现的图像
                    光谱 CT 采用稀有金属钇和稀土陶瓷材质的双                        特征,有助于建立诊断预测模型,为个体精准医疗
                层探测器结构,在不更改常规扫描流程的同时可以                            提供有利的条件        [20] 。已有研究表明影像组学在预
                获取能谱信息如碘密度图、能谱曲线等                  [15] 。本研究      测甲状腺结节良恶性方面具有一定潜力,Park 等                    [21]
                发现恶性甲状腺结节的 NIC 显著低于良性结节,与                         使用超声图像的影像组学特征进行分类得出的
                先前的研究结果一致          [16] 。良性甲状腺结节测量出               AUC为0.75,武欣欣等      [22] 结合CT的平扫与增强特征
                了较高的碘值,其原因主要是它们在组织结构上保                            及临床数据得到了更好的AUC为0.793。本研究运
                留了正常甲状腺细胞的功能和更加丰富的血管供                             用了差异性比较、组间一致性评估与 LASSO 的方
                给,增强了碘造影剂的输送和积累                [17] 。与此相对,        法,最终筛选出了与良恶性相关的 3 个一阶特征与
                恶性甲状腺结节内部的纤维化、坏死或钙化以及更                            3 个 纹 理 特 征 。 其 中 ,一 阶 特 征 10Percentile 与
                多的异常紊乱血管导致血流量下降,表现出碘值的                            90Percentile 表示直方图灰度强度的分布,Minimum
                降低  [18] 。本研究还发现,年龄是甲状腺恶性结节的                      则表示为图像的最小像素值,GLSZM、NGTDM 与
                预测风险因素。其原因可能与激素水平异常相关,                            GLCM 主要提供纹理的变化和细节丰富度的信息,
                特别是女性青春期与孕期的雌激素和孕激素波动,                            上述特征表明良性与恶性结节在不同维度上的异
                这些激素的显著变化可影响甲状腺细胞受体或模                             质性  [23] 。为了提升ML预测效能,本研究比较了6种
                拟TSH的活性来改变甲状腺功能,进而促进甲状腺                           不同的 ML 算法,发现 XGBoost 表现最优,在验证集
                癌的发展    [19] 。此外,青年人群健康意识的提升及甲                    中的 AUC 达到了 0.938。XGBoost 是一种高效准确
                状腺超声检查的广泛应用,也可能是甲状腺结节检                            的集成学习方法,通过梯度提升和极端情况下的处
                出率提高的原因之一。                                        理能力,能优化多个决策树以逐步减小模型的预测
   74   75   76   77   78   79   80   81   82   83   84