Page 88 - 南京医科大学学报自然科学版
P. 88
第43卷第9期
·1266 · 南 京 医 科 大 学 学 报 2023年9月
+
透明细胞肾细胞癌(clear cell renal cell carcino⁃ 种正常细胞含量,获得 3 个 CD8 T 浸润评分、TMB、
ma,ccRCC)是肾细胞癌最常见的类型 [1-2] ,相比乳头状 MSI、4 种免疫耗竭相关基因(LAG3、CD244、PDCD1
和嫌色细胞亚型,更容易进展、转移,预后较差 [3-4] 。患 及 TIGIT) 以及 21 种免疫细胞得分(使用 R 语言
[15]
者状态、肿瘤分期、细胞核分级等是临床实践中常 estimate 包中的 ESTIMATE 算法),根据得分中位数
用的预后指标。然而,随着ccRCC 个体化治疗的不 分为高、低表达两组。
断发展,特别是晚期肾癌,免疫治疗仅对 20%~30% 1.2 方法
的患者有效,目前尚无有效靶标对患者进行筛选和 1.2.1 CT图像勾画和特征提取
疗效预测 。 使用国内开发的软件 SRhythm Multi Label 和
[5]
肿瘤微环境包括细胞外基质、可溶性分子和肿 Oncology Imaging Analysis(OCIA,上海师范大学上
瘤基质细胞,对肿瘤患者的免疫治疗疗效及预后影响 海磁共振重点实验室),分别由1名具有3年腹部影
重大 [6- 7] 。肿瘤突变负荷(tumor mutational burden, 像诊断经验的放射科医师和1名具有6年临床手术
TMB)即每个肿瘤基因组编码区域的突变总数,是免 经验的泌尿外科医生在 CT 皮质期轴位图像上对病
疫治疗的生物标志物,TMB越高的肿瘤患者免疫治 灶边缘进行逐层勾画,然后融合成三维感兴趣区
疗效果往往越好 [8-9] 。微卫星不稳定性(microsatellite (region of interest,ROI);每一次勾画均由另 1 名具
instability,MSI)即重复 DNA 束中核苷酸的自发丢 有 15 年腹部影像诊断经验的放射科医师进行校
失或获得,可以辅助诊断胃肠道、子宫内膜和结直肠 对。校准完毕后利用 Pyradiomics 软件包提取肿瘤
肿瘤的表型,为各种癌症提供治疗决策信息 [10-11] 。基 影像组学特征,包括 14 个形状特征、18 个一阶直方
于机器学习(machine learning,ML)的CT影像组学分 图特征以及75个纹理特征、24个灰度共生矩阵(gray
析可捕获肉眼无法识别的图像特征,并揭示病理生理 level co⁃occurrence matrix,GLCM)特征、16个灰度游
相关的潜在生物医学图像变化,预测治疗反应和生存 程矩阵(gray level run⁃length matrix,GLRLM)特征、
期 [11-13] 。 16 个灰度区域大小矩阵(gray level size zone matrix,
因此,本研究利用集成ML算法,将ccRCC影像 GLSZM)特征、5 个邻域灰度差分矩阵(neighborhood
组学特征与肿瘤免疫微环境表达相关联,建立多模 gray⁃tone difference matrix,NGTDM)特征、14个灰度相
通道的免疫影像(immuno⁃radiomics,ImRad)分型, 关矩阵(gray level dependence matrix,GLDM)特征 。
[16]
并进一步研究该表型对患者术后生存的预测价值。 1.2.2 模型构建
构建肿瘤 ImRad:①降维及特征筛选。考虑高
1 对象和方法
维数据ML 建模产生的过拟合风险,首先采用4种特
1.1 对象 征 筛 选 算 法 ,即 信 息 增 益(information gain,Info.
纳入南京医科大学第一附属医院经手术病理 gain)、增益率(gain ratio)、基尼系数下降(gini de⁃
证实为ccRCC、术前行肾脏CT增强扫描且具有完整 crease,Gini)、快速相关滤波器(fast correlation based
临床病理及免疫基因资料的患者 113 例。其中,男 filter,FCBF),分别对影像组学特征降维筛选。②集
77 例,女36例,年龄(59.4±12.9)岁(26~88岁);AJCC 成 ML 建模。利用随机森林(random forest,RF)、梯
分期 68.1%为 T1~2 期,31.9%为 T3~4 期;41.6%为低 度增强(gradient boosting,GDBT)、逻辑回归(logistic
级别细胞核分级,58.4%为高级别。113例患者均有 regression,LR)、支 持 向 量 机(support vector ma⁃
标准随访结果,随访内容包括治疗后有无复发及总 chines,SVM)、朴素贝叶斯(naive bayes,NB)、k 最近
生存时间(overall survival,OS),随访时间为 1~86 个 邻(k⁃nearest neighbor,kNN)、神经网络(neural net⁃
月,删失病例 OS 按最长随访时间计算。中位 OS 为 work,NN)及堆叠式集成学习(stacking learning)8 种
31(10~54)个月。 算法在经筛选后的 20 个组学特征上建立二分类预
[17]
患者临床、影像数据从公开数据库癌症影像档 测模型 ,预测目标包含3个CD8 T浸润评分、1个
+
案(the cancer imaging archive,TCIA)下 载(http:// TMB 表达、1 个 MSI 表达、4 个免疫耗竭相关基因及
www.cancerimagingarchive.net),对应免疫、基因数据 21 种免疫细胞浸润表达结果,共建立 30 个 ImRad
从癌症基因图谱(the cancer genome atlas,TCGA)库 表型。多种分类器算法的消融实验以获得最优算
中获得(https://portal.gdc.cancer.gov) 。利用癌症 法,五折法用于小样本数据下模型的准确性验证。
[14]
样本转录谱的特性来推断肿瘤细胞以及浸润的各 生存分析:纳入指标包括患者性别、年龄、