Page 149 - 南京医科大学学报自然科学版
P. 149

第41卷第4期          徐青青,单文莉,朱 艳,等. 基于CT影像组学对孤立性肺结节性质分类的预测效能[J].
                  2021年4月                     南京医科大学学报(自然科学版),2021,41(04):617-623                       ·619 ·


                可靠性。可重复性和稳定性好的特征用来建立组学                                模型 2 包括恶性非浸润结节 51 例及浸润性结
                标签。利用选择特征的线性融合计算影像组学标签                            节 67 例,共提取出 1 261 个高通量特征,利用 L1 正
                得分。校正曲线用于评价模型的预测效果。决策曲                            则 C 值 0.01 特征选择以及 SVM 分类器建立模型。
                线用于评价预测模型的潜在临床净收益。                                共筛选出2个鲁棒的特征,包括2个纹理特征,拉普
                1.3  统计学方法                                        拉斯变换⁃灰度级区域矩阵⁃区域熵(log⁃sigma⁃5⁃0⁃
                    采用 SPSS 20.0 进行统计分析,3 组间患者年龄                  mm⁃3D_glszm_Zone Entropy)和小波变换⁃灰度级区
                采用单因素方差分析,两两比较采用 LSD 法,性别                         域矩阵⁃区域熵(wavelet⁃LLL_glszm_Zone Entropy)。
                分布差异比较采用χ 检验。一致性检验、特征提取、                          影像组学评分(Rad⁃score)反映恶性非浸润及浸润
                                  2
                模型建立和统计学比较等运算,以及图表的绘制都                            结节在训练组和测试组的分布情况(图1C)。
                是基于 Anaconda3 平台(https://www.ana conda.com)           模型 3 包括良性结节 71 例、恶性非浸润结节

                的 Pyhton (https://www.python.org/) Scikit ⁃ learn  51 例及浸润结节 67 例,共提取出 1 261 个高通量特
               (https://scikit⁃learn.org/)和Matplotlib 库(https://mat⁃  征。模型3利用F⁃test 5%特征选择以及逻辑回归分
                plotlib.org/)进行的。P < 0.05为差异有统计学意义。               类器建立模型,共筛选出20个鲁棒的特征,包括一阶
                                                                  特性12个,纹理特征8个(图1D),其中小波变换⁃灰度
                2  结 果
                                                                  级区域矩阵⁃灰度不均匀性(wavelet⁃LLL_glszm_Gray
                2.1  患者一般资料                                       Level Non⁃Uniformity Normalized)及拉普拉斯变换⁃一
                    189 例肺结节大小 5.8~29.8 mm,平均(15.4±               阶特征⁃四分位数范围(log⁃sigma⁃1⁃0⁃mm⁃3D_fir⁃
                5.9)mm,分为3组,良性组71例,恶性非浸润组51例,                     storder_interquartile Range)等相对权重最大。
                浸润组67例。3组年龄差异有统计学意义,两两比较                          2.3  3种模型的效度、可靠性及收益
                显示,浸润组的年龄[(57.6±8.7)岁]要高于良性组                          预测模型 1 在训练组中的 AUC 值为 0.92,在测
               [(53.1±9.9)岁]和恶性非浸润组[(53.4±11.5)岁],差               试组中的 AUC 值为 0.85;预测模型 2 在训练组中的
                异有统计学意义(P=0.008,P=0.024),良性组与恶性                   AUC 值为 0.92,在测试组中的 AUC 值为 0.89;预测
                非浸润组差异无统计学意义(P=0.873)。3组性别差                       模型 3 在训练组中的 AUC 值为 0.88,在测试组中的
                异有统计学意义(χ =19.618,P < 0.001),浸润组、恶                AUC 值为 0.84。3 种模型的预测结果见表 1。预测
                                 2
                性非浸润组女性比例高于良性组,差异均有统计学                            模型的ROC曲线见图2,将模型1和模型2的预测概
                意义(60% vs. 35%,χ =8.298,P=0.004;75% vs. 35%,      率绘制成决策曲线(图3)及校准曲线(图4)。
                                  2
                χ =18.355,P < 0.001),恶性非浸润组及浸润组差异
                 2
                                                                  3  讨 论
                无统计学意义(χ =2.834,P=0.092)。
                              2
                2.2  影像组学特征提取、选择和组学标签建立                               CT薄层扫描技术在肺结节的诊断分类、治疗方
                    观察者组内和组间 ICC 值分别为 0.89、0.81,一                 案的制定、疗效评价及预后评估等方面发挥着重要
                                                                        [7]
                致性良好。后续特征提取、筛选和建模所有图像的                            的作用 。然而,临床工作中影像医生常使用几种
                分割数据集由5年经验的医师第1次分割的数据组                            形态学特征来评估胸部CT肺结节的恶性特征,包括
                成。模型 1 包括良性结节 71 例及恶性结节 118 例                     结节大小、边缘、轮廓和内部特征,而蕴含在数字化
               (包括 51 例恶性非浸润性结节及 67 例浸润性结                         图像中的大量信息没有被利用。影像组学是一个

                节),共提取出 1 261 个高通量特征,通过 F⁃test 5%                 新兴技术,它通过高通量地提取医学图像中的大量
                特征选择进行特征筛选,逻辑回归分类器建立模                             定量影像学特征,与传统的视觉图像相比,它可以
                型。模型 1 共筛选出 20 个鲁棒的特征,包括一阶                        提取出更多的肺结节特征,并以非侵入性的方式评
                                                                                       [8]
                特征 10 个及纹理特征 10 个(图 1A),其中拉普拉斯                    估肺结节和肿瘤的行为 。目前已有研究表明影像
                变换⁃灰度相关矩阵⁃弱相关(log⁃sigma⁃1⁃0⁃mm⁃                   组学在肿瘤病理亚型鉴别、基因表达、病灶的良恶
                3D_gldm_Small Dependence Emphasis)、拉普拉斯变          性鉴别、淋巴结转移、疾病的治疗及预后方面表现

                换⁃一阶特征⁃中位数(log⁃sigma⁃1⁃0⁃mm⁃3D_first⁃or⁃          出较好的前景       [9-12] 。临床工作中医生视觉鉴别诊断
                der_Median)等相对权重最大。影像组学评分(ra⁃                     良恶性、浸润前和浸润程度有很大难度,而本研究
                diomics score,Rad⁃score)反映良、恶性结节在训练组              对于多分类模型进行研究,填补了该多分类模型的
                和测试组的分布情况(图1B)。                                   空白,具有一定的临床应用价值,可以辅助决策临
   144   145   146   147   148   149   150   151   152   153   154