Page 88 - 南京医科大学学报自然科学版
P. 88

第43卷第9期
               ·1266 ·                           南 京    医 科 大 学 学         报                        2023年9月


                                                                                             +
                  透明细胞肾细胞癌(clear cell renal cell carcino⁃       种正常细胞含量,获得 3 个 CD8 T 浸润评分、TMB、
              ma,ccRCC)是肾细胞癌最常见的类型            [1-2] ,相比乳头状      MSI、4 种免疫耗竭相关基因(LAG3、CD244、PDCD1
              和嫌色细胞亚型,更容易进展、转移,预后较差                  [3-4] 。患   及 TIGIT) 以及 21 种免疫细胞得分(使用 R 语言
                                                                         [15]
              者状态、肿瘤分期、细胞核分级等是临床实践中常                            estimate 包中的 ESTIMATE 算法),根据得分中位数
              用的预后指标。然而,随着ccRCC 个体化治疗的不                         分为高、低表达两组。
              断发展,特别是晚期肾癌,免疫治疗仅对 20%~30%                        1.2  方法
              的患者有效,目前尚无有效靶标对患者进行筛选和                            1.2.1 CT图像勾画和特征提取
              疗效预测 。                                                 使用国内开发的软件 SRhythm Multi Label 和
                      [5]
                  肿瘤微环境包括细胞外基质、可溶性分子和肿                          Oncology Imaging Analysis(OCIA,上海师范大学上
              瘤基质细胞,对肿瘤患者的免疫治疗疗效及预后影响                           海磁共振重点实验室),分别由1名具有3年腹部影
              重大  [6- 7] 。肿瘤突变负荷(tumor mutational burden,       像诊断经验的放射科医师和1名具有6年临床手术
              TMB)即每个肿瘤基因组编码区域的突变总数,是免                          经验的泌尿外科医生在 CT 皮质期轴位图像上对病
              疫治疗的生物标志物,TMB越高的肿瘤患者免疫治                           灶边缘进行逐层勾画,然后融合成三维感兴趣区
              疗效果往往越好       [8-9] 。微卫星不稳定性(microsatellite       (region of interest,ROI);每一次勾画均由另 1 名具
              instability,MSI)即重复 DNA 束中核苷酸的自发丢                 有 15 年腹部影像诊断经验的放射科医师进行校
              失或获得,可以辅助诊断胃肠道、子宫内膜和结直肠                           对。校准完毕后利用 Pyradiomics 软件包提取肿瘤
              肿瘤的表型,为各种癌症提供治疗决策信息                   [10-11] 。基  影像组学特征,包括 14 个形状特征、18 个一阶直方
              于机器学习(machine learning,ML)的CT影像组学分                图特征以及75个纹理特征、24个灰度共生矩阵(gray
              析可捕获肉眼无法识别的图像特征,并揭示病理生理                           level co⁃occurrence matrix,GLCM)特征、16个灰度游
              相关的潜在生物医学图像变化,预测治疗反应和生存                           程矩阵(gray level run⁃length matrix,GLRLM)特征、
              期 [11-13] 。                                       16 个灰度区域大小矩阵(gray level size zone matrix,
                  因此,本研究利用集成ML算法,将ccRCC影像                       GLSZM)特征、5 个邻域灰度差分矩阵(neighborhood
              组学特征与肿瘤免疫微环境表达相关联,建立多模                            gray⁃tone difference matrix,NGTDM)特征、14个灰度相
              通道的免疫影像(immuno⁃radiomics,ImRad)分型,                关矩阵(gray level dependence matrix,GLDM)特征 。
                                                                                                          [16]
              并进一步研究该表型对患者术后生存的预测价值。                            1.2.2 模型构建
                                                                     构建肿瘤 ImRad:①降维及特征筛选。考虑高
              1  对象和方法
                                                                维数据ML 建模产生的过拟合风险,首先采用4种特
              1.1  对象                                           征 筛 选 算 法 ,即 信 息 增 益(information gain,Info.
                  纳入南京医科大学第一附属医院经手术病理                           gain)、增益率(gain ratio)、基尼系数下降(gini de⁃
              证实为ccRCC、术前行肾脏CT增强扫描且具有完整                         crease,Gini)、快速相关滤波器(fast correlation based
              临床病理及免疫基因资料的患者 113 例。其中,男                         filter,FCBF),分别对影像组学特征降维筛选。②集
              77 例,女36例,年龄(59.4±12.9)岁(26~88岁);AJCC             成 ML 建模。利用随机森林(random forest,RF)、梯
              分期 68.1%为 T1~2 期,31.9%为 T3~4 期;41.6%为低            度增强(gradient boosting,GDBT)、逻辑回归(logistic
              级别细胞核分级,58.4%为高级别。113例患者均有                        regression,LR)、支 持 向 量 机(support vector ma⁃
              标准随访结果,随访内容包括治疗后有无复发及总                            chines,SVM)、朴素贝叶斯(naive bayes,NB)、k 最近
              生存时间(overall survival,OS),随访时间为 1~86 个            邻(k⁃nearest neighbor,kNN)、神经网络(neural net⁃
              月,删失病例 OS 按最长随访时间计算。中位 OS 为                       work,NN)及堆叠式集成学习(stacking learning)8 种
              31(10~54)个月。                                      算法在经筛选后的 20 个组学特征上建立二分类预
                                                                      [17]
                  患者临床、影像数据从公开数据库癌症影像档                          测模型 ,预测目标包含3个CD8 T浸润评分、1个
                                                                                               +
              案(the cancer imaging archive,TCIA)下 载(http://     TMB 表达、1 个 MSI 表达、4 个免疫耗竭相关基因及
              www.cancerimagingarchive.net),对应免疫、基因数据           21 种免疫细胞浸润表达结果,共建立 30 个 ImRad
              从癌症基因图谱(the cancer genome atlas,TCGA)库            表型。多种分类器算法的消融实验以获得最优算
              中获得(https://portal.gdc.cancer.gov) 。利用癌症          法,五折法用于小样本数据下模型的准确性验证。
                                              [14]
              样本转录谱的特性来推断肿瘤细胞以及浸润的各                                  生存分析:纳入指标包括患者性别、年龄、
   83   84   85   86   87   88   89   90   91   92   93