摘要
目的:构建并验证一个基于术前增强CT影像组学特征联合临床因素的列线图模型,用于术前预测胃癌患者的阳性淋巴结比率(lymph node ratio,LNR),以期为个体化治疗决策提供依据。方法:回顾性收集380例行胃癌根治术患者的临床及术前增强CT资料,按7∶3的比例划分为训练集(n=266)与验证集(n=114)。使用PyRadiomics平台提取动脉期和静脉期图像的影像组学特征,经特征筛选后,采用支持向量机(support vector machine,SVM)、随机森林(random forest,RF)和逻辑回归(logistic regression,LR)3种机器学习算法构建预测模型。通过受试者工作特征(receiver operating characteristic,ROC)曲线下面积(area under the curve,AUC)、决策曲线分析(decision curve analysis,DCA)评估模型性能。将显著预测因素纳入多因素Logistic回归分析并构建列线图。结果:RF模型预测性能最佳,其在训练集和验证集中的AUC值分别为0.733和0.778。多因素分析确定性别、临床N分期(cN)和影像组学评分(Rad-score)是LNR的独立预测因素(P均<0.05)。基于上述因素构建的列线图模型在验证集中表现出优异的预测效能,AUC为0.821,且DCA显示其具有较高的临床净获益。结论:成功构建了一个融合影像组学与临床因素的列线图模型,能够在术前有效预测胃癌患者的LNR状态,有助于识别高危患者并指导个体化治疗。
Abstract
Objective:To develop and validate a nomogram model based on preoperative contrast -enhanced CT radiomic features combined with clinical factors for predicting the lymph node ratio(LNR)in gastric cancer patients,aiming to provide a basis for individualized treatment decision-making. Methods:Clinical data and preoperative enhanced CT images of 380 patients who underwent radical gastrectomy were retrospectively collected and divided into a training set(n=266)and a validation set(n=114)in a 7∶3 ratio. Radiomic features were extracted from arterial and venous phase images using the PyRadiomics platform. After feature selection,three machine learning algorithms,namely support vector machine(SVM),random forest(RF),and logistic regression(LR), were employed to build prediction models. Model performance was evaluated using the area under the receiver operating characteristic (ROC)curve(AUC)and decision curve analysis(DCA). Significant predictors were incorporated into multivariate logistic regression to construct a nomogram. Results:The RFmodel demonstrated the best predictive performance,with AUC values of 0.733 and 0.778 in the training set and validation set,respectively. Multivariate analysis identified sex,clinical N stage(cN),and radiomic score(Rad-score)as independent predictors of LNR(all P < 0.05). The nomogram incorporating these factors showed excellent predictive efficacy in the validation set,with an AUC of 0.821,and DCA indicated favorable clinical net benefit. Conclusion:A nomogram integrating radiomics and clinical factors was successfully developed and validated for the preoperative prediction of LNR in gastric cancer patients,which can effectively predict the LNR status of gastric cancer patients preoperatively,helping to identify high-risk patients and guide individualized treatment strategies.
Keywords
胃癌是全球范围内发病率和病死率较高的恶性肿瘤之一[1]。我国是胃癌高发区,每年新发病例数和死亡病例数均占全球的 40%以上[2]。尽管近年来胃癌的诊疗水平不断提高,但总体 5 年生存率仍不足 30%,预后较差。淋巴结转移是胃癌的主要转移途径,胃癌淋巴结转移与其预后不良密切相关。淋巴结转移不仅可引起局部复发,还可经淋巴管进入血液循环,发生远处器官转移。
术后TNM 分期系统是评估胃癌进展程度的标准,其中 N 分期是影响患者预后的重要因素之一。传统的 N 分期仅考虑淋巴结数量,且易受到淋巴结检查数目影响,存在分期迁移现象[3],不能全面反映胃癌的淋巴结转移情况。因此,近年来出现了许多关于改良 N 分期的研究,如阳性淋巴结比率(lymph node ratio,LNR)和阳性淋巴结对数比等,其中 LNR 相比传统 N 分期可以更好地评估淋巴结转移情况[4]。LNR越高,说明手术切除后残余淋巴结中转移淋巴结的可能性越高。术后残余阳性淋巴结与术后高复发率密切相关,对于存在术中淋巴结未能完全切除的高风险患者[5],术前化疗可以有效弥补手术中阳性淋巴结未能完全切除的风险,改善患者预后。因此,淋巴结转移状态的术前预测对于治疗方案的制定和预后评估至关重要。
增强CT为胃癌术前分期的首选诊断方式。然而,目前判断转移淋巴结的标准仍然以淋巴结短径为主,但在临床实践中,并非所有增大的淋巴结都是阳性淋巴结,此外,部分小淋巴结在CT上并不可见。因此,术前分期评估在很大程度上取决于放射科医生的判断,存在主观性,如何提高阳性淋巴结的检出率仍是一个亟待解决的临床问题。影像组学作为一种新兴的定量影像分析技术,通过提取医学影像中蕴含的大量特征,可以客观、定量地反映肿瘤生物学行为[6]。高通量影像组学特征与肿瘤的病理特征密切相关,有望成为评估淋巴结转移的无创性生物标志物[7-9]。与传统影像学相比,影像组学能够反映肿瘤内部的空间异质性,这与肿瘤的微观病理学特征相对应。因此,影像组学有望弥补常规影像学方法的不足,为胃癌淋巴结转移评估提供更准确、更全面的信息。
因此,本研究借助影像组学技术并结合临床信息对术前胃癌患者的LNR状态进行评估,以便帮助临床医生制定个性化的胃癌治疗策略。
1 对象和方法
1.1 对象
收集南京医科大学第一附属医院 2014—2018年行胃癌根治术的患者,根据纳排标准最终纳入 380 例患者进行回顾性研究,收集资料包括性别、年龄、术前CT影像、术前血液检验数据、手术方式、术后病理资料等。肿瘤浸润深度、淋巴结转移分期及病理分期均按美国癌症联合委员会(American Joint Committee on Cancer,AJCC)第8版TNM分期系统进行。本研究经南京医科大学第一附属医院伦理审查委员会批准(伦审号:2024⁃SR⁃180),患者均知情同意。
纳入标准:①原发性胃癌,经术后病理证实为腺癌;②术前未行新辅助治疗;③术前检查未发现远处转移病灶;④接受的手术均为标准胃癌根治术,且为R0 切除;⑤有完整的术前影像资料。排除标准:①术前已有明确的远处转移病灶;②经术前检查证实非原发性胃癌;③术前采用了新辅助化疗;④接受姑息性手术或治疗;⑤重要病例资料缺失;⑥患有可能严重影响检查检验结果的其他疾病。
1.2 方法
1.2.1 随访
截至随访结束(2022 年 12 月 31 日),患者死亡 127 例(33.42%),失访 32 例(8.42%),存活 221 例 (58.16%),中位生存时间为 51 个月。术后患者每 6个月随访1次,随访内容包括肿瘤标志物、CT等检查结果,主要为电话随访,也有门诊和网络随访。
1.2.2 影像组学分析
所有患者术前均于本院接受腹部CT增强扫描。检查采用 128 层 CT 扫描仪(Siemens SOMATOM Definition AS+,德国)。患者禁食 4~6 h 后取仰卧位,扫描范围自膈顶至盆底,于屏气状态下完成。扫描参数如下:管电压120 kVp,管电流180 mAs,螺距0.5 s,矩阵512×512,重建层厚1.5 mm。扫描程序包括平扫及增强两期:经肘静脉以高压注射器注入非离子型对比剂,剂量为 1.5 mL/kg,流率 3.5 mL/s,采用团注追踪法于腹主动脉内设置感兴趣区 (region of interest,ROI),触发阈值 100 HU,分别延迟20 s及50 s行动脉期与静脉期扫描。
由2名分别具有3年及5年胃肠肿瘤CT诊断经验的放射科医师独立勾画病灶ROI,所有勾画均在统一窗宽(1 200 HU)、窗位(-600 HU)下进行,使用组内相关系数(intraclass correlation coefficient,ICC)评估观察者间一致性,ICC>0.85 表明勾画具有良好可重复性。ROI勾画示意图如图1所示。特征提取主要通过PyRadiomics工具完成。
数据预处理与降维具体步骤如下:①为了消除训练数据集中正负样本比例不平衡的影响,通过随机重复部分样本的方式进行采样,使得阳性/阴性样本的比例达到平衡;②对特征矩阵进行归一化处理。由于不同特征的数值差别较大,将不同特征的数值缩放到相同的数量级。具体而言,对每个特征向量,计算其均值和标准差,然后将该特征向量的每个值减去均值,再除以标准差;③在归一化处理后,每个特征向量都具有零均值和单位标准差。通过计算特征两两之间的皮尔森相关系数(Pearson corre⁃ lation coefficients,PCC)进行降维。如果某一对特征的PCC值>0.990,删除其中一个特征。本研究采用支持向量机(support vector machine,SVM)、随机森林 (random forest,RF)和逻辑回归(logistic regression, LR)3种机器学习的方法进行特征筛选及建模。
1.3 统计学方法
以SPSS 26.0和R 4.4.2等统计学软件进行数据分析,以均数±标准差()描述正态分布计量资料,行独立样本t检验。采用χ2 检验或Fisher精确概率法比较计数资料。不符合正态分布的计量资料以中位数(四分位数)[M(P25,P75)]表示,组间比较采用 Mann⁃Whitney U检验(两组)或 Kruskal⁃Wallis H检验(多组)。采用R软件中的surv_cutpoint算法计算最佳截断值,以单因素和多因素Logistic回归分析逐步向后回归法筛选胃癌LNR的独立预测因素,据此分别构建模型。采用受试者工作特征(receiver operating characteristic,ROC)曲线及曲线下面积 (area under the curve,AUC)评估各模型术前预测胃癌LNR的效能,P <0.05为差异有统计学意义。
2 结果
2.1 LNR分层的生存分析
首先使用R软件中的surv_cutpoint算法计算患者LNR的最佳截断值为0.21(图2A),根据患者LNR 数值将患者分为高LNR组与低LNR组,使用Kaplan⁃ Meier方法的Log⁃rank检验显示,高LNR组与低LNR 组之间的总生存期(overall survival,OS)差异存在统计学意义(P <0.01,图2B)。
2.2 患者一般特征
本研究按照纳排标准共纳入380例患者,按照 7∶3 的比例对患者进行数据分割,266 例作为训练集,114 例作为验证集。训练集患者年龄(62.3± 10.2)岁(26~84 岁),验证集患者年龄(62.1±9.6)岁 (38~89岁),男女比例均为约7∶3。训练集中高LNR 患者 113 例(42.5%),验证集中高 LNR 患者 48 例 (42.1%),两组之间的高LNR 比例无明显差异。两组的 LNR 均不符合正态分布,训练集中位 LNR 为 0.172,验证集中位 LNR 为 0.167。其他研究变量在验证集和训练集中差异也均无统计学意义,表明两组具备可比性(表1)。
图1ROI勾选示意图
Figure1Schematic diagram of ROI delineation
2.3 模型性能验证
基于训练组数据选择 SVM、RF 和 LR 3 种机器学习的方法来建立 LNR 的预测模型。3 种算法均使用网格搜索和十折交叉验证进行调参调优,并在选择最佳参数后确定最终模型。基于分析筛选的特征变量构建预测模型,模型均具有良好的稳定性,各模型均无明显的过拟合或欠拟合。经过 ROC 曲线验证后,在训练集和验证集中,RF 模型的综合性能最佳,在训练集和验证集中 AUC 值均为最高(训练集 AUC=0.733,验证集 AUC= 0.778,图3)。在特异度和敏感度方面,RF 模型的敏感度在训练集和验证集中均为最佳(训练集中为 0.735,验证集为 0.562),而 SVM 模型的特异度在训练集和验证集中均为最佳(训练集为0.889,验证集为0.924)。综合考虑,采用RF结果作为影像组学模型评分(radiomic score)依据进一步分析。
2.4 单因素与多因素Logistic回归分析
将术前患者的基本信息、肿瘤学指标及模型判读结果以及术后病理信息纳入单因素Logistic回归分析(表2),根据多因素分析结果显示,仅有临床N 分期(cN)、影像组学评分、性别为影响胃癌淋巴结转移阳性率的独立危险因素,其余指标均无显著预测效力。其中,影像组学评分的 OR 值最高为 7.185,是3个因素中对LNR结局影响最大的因素。
图2基于LNR分层的生存分析
Figure2Stratified survival analysis based on LNR
表1两组患者基本信息比较
Table1Comparison of basic information between the two groups of patients
2.5 建立列线图
根据多因素 Logistic 筛选出的 3 个因素(性别、 cN分期以及影像组学评分)建立针对高LNR风险的列线图(图4A)并绘制ROC曲线(图4B),AUC值为0.82 1,说明模型具有令人满意的预测效能。同时,绘制了影像组学模型对于LNR预测效能的ROC曲线,其AUC 值为 0.657,低于列线图模型。之后,又绘制了 2 种模型预测 LNR 得出的决策曲线分析 (decision curve analysis,DCA)(图5),可以看出列线图模型相比单纯影像组学模型预测效能都要更佳,收益更高。
图3训练集(A)和验证集(B)的3种模型ROC曲线分析
Figure3ROCcurves of the3 models in the training set(A)and the validation set(B)
表2单因素与多因素Logistic回归
Table2Univariate and multivariate logistic regression analyses
3 讨论
胃癌作为全球范围内高发病率和病死率的恶性肿瘤,长期以来一直是影响公众健康的重要因素。根据世界卫生组织数据,胃癌是全球第3大致死癌症,且多数患者在确诊时已处于中晚期。而淋巴结转移情况与胃癌患者的预后显著相关。cN分期是评估胃癌患者预后的一个重要指标,广泛使用的AJCC病理N分期(pN)系统主要依据淋巴结转移的数量来分类。这种局限性导致了分期迁移现象的出现,从而影响患者的准确分期与预后判断。分期迁移现象是指由于诊断技术进步或治疗策略改变,患者的分期发生了变化,这种现象严重影响了临床预后评估的准确性。Will⁃Rogers现象是一种典型的分期迁移效应,指的是转移性淋巴结的数量与淋巴结清扫范围呈正比,即清扫的淋巴结越多,检测到的转移淋巴结越多,从而可能导致患者分期升高,影响临床决策[3]。2005年,Smith等[10] 利用监测数据库的流行病学特征分析了3 814例不同分期的胃癌患者。在同一分期中,检测到超过15个淋巴结的患者生存时间优于检测到少于15个淋巴结的患者。通过增加淋巴结清扫范围,可以逐渐减少或避免淋巴结分期迁移。
图4列线图(A)及其校正曲线(B)
Figure4Nomogram(A)and its calibration curve(B)
图5列线图与单纯影像组学ROC验证曲线(A)与DCA曲线(B)对比
Figure5Comparison of the ROC validation curves(A)and decision curve analysis curves(B)between the nomogram and the radiomics⁃only model
然而,淋巴结检出数目常受限于术者的技术和淋巴结示踪技术等客观因素的影响,因此准确的淋巴结分期至关重要。为了解决这一问题,学者们提出了一些改良的分期指标[11-12]。其中LNR能够更准确地反映淋巴结转移负荷,减少传统N分期带来的分期迁移效应。已有研究表明,LNR与患者的生存期密切相关,相比传统的N分期,LNR在胃癌患者的预后评估中表现出更高的敏感性和准确性。有研究报道远端胃切除患者,标本中检出更多的淋巴结可增加转移淋巴结数量,而LNR则与检出淋巴结数无关;并且还发现当 LNR 增长 10%,胃癌患者 5 年生存率下降8.14%,即LNR与胃癌患者生存密切相关[13]。本研究发现,高低LNR两组之间的生存时间存在显著差异(P <0.05),且 LNR 的截断值为 0.21,与既往研究报道类似[4,14]。既往研究报道年龄、性别、术前分期等因素与胃癌患者LNR 高低相关[15]。本研究同样也发现性别和 cN 是胃癌患者高 LNR 的独立危险因素,女性和较晚的 cN 分期会导致高 LNR 的风险增加,这可能与女性患者更易发生弥漫型胃癌(如印戒细胞癌)有关,该类肿瘤更易发生淋巴结转移。
尽管 LNR 是一个有效的预后指标,但传统的 LNR评估依赖于术后病理结果,该结果只能在术后获得,而对于高LNR 患者,可能存在未切除的阳性淋巴结,增加术后转移的风险。术前如何准确预测 LNR 变得非常具有挑战性。对于术前 LNR 高的患者可进行新辅助治疗,对N分期进行降期,降低手术残余阳性淋巴结的几率。影像组学作为一种通过影像数据提取大量特征并进行分析的技术,已被证明在多种肿瘤的预后评估中具有重要价值。通过影像组学提取的特征,对特征进行降维提取后建立模型进行分析,再结合传统的临床和病理信息,就能够实现对 LNR 的术前精准预测。本研究正是基于影像组学方法,结合机器学习技术,成功构建了一个能够在术前预测胃癌患者LNR的回归模型,并进一步开发了易于临床应用的列线图模型。通过 ROC曲线和DCA曲线,本研究系统地比较了列线图模型与单纯影像组学模型在LNR预测方面的性能,结果显示,列线图模型在预测能力和临床决策效用上均优于影像组学模型(列线图的AUC值为0.821,影像组学模型的AUC值为0.657)。这一发现表明,结合临床信息可以在小样本量的情况下有效提高机器学习预测模型的预测效能,为胃癌患者的术前评估提供了一种更为精准的工具,也为同样小样本情况下其他模型的开发提供了经验。
既往研究已证明 LNR 在胃癌患者预后评估中的重要性,且部分研究尝试利用影像组学方法预测淋巴结转移风险。有研究基于CT影像提取影像组学特征,建立分类模型用于预测淋巴结转移状态,但多数研究局限于淋巴结转移阳性或pN分期而未进一步量化 LNR[16]。这可能导致即使对淋巴结转移状态的预测效能较好,仍无法精准指导患者治疗方案。本研究同样是从患者术前影像资料提取特征后通过机器学习建立模型获取影像组学评分,再结合临床资料,通过回归建模量化 LNR,进一步开发列线图模型用于临床实践,这能够综合考虑患者的临床、病理和影像学特征,并通过直观的列线图形式展示预测的LNR水平[17],为术前评估提供更精准的信息,而不仅仅是二分类预测,并且使得 LNR 预测结果可视化,提高了模型的可解释性和临床可用性。值得注意的是,在列线图中cN分期为0的得分超过了cN分期为1,但是差距并不是很明显,这可能是因为淋巴结转移早期在术前CT中的辨识度不高,分期判读不准确导致。与仅基于影像特征建立的模型相比,本研究的列线图模型在AUC及DCA中均展现出更优的性能,表明影像组学模型结合临床信息的策略使得其在LNR预测效能方面显著提升。
LNR 是新辅助胃癌患者预后的良好预测指标。与低 LNR 患者相比,高 LNR 患者的预后明显更差[18-19]。利用本研究的模型可对患者进行术前 LNR 预测,如有较高 LNR 预测值的患者,则可以选择在术前通过新辅助化疗来实现临床N分期降期或在术中扩大淋巴结清扫范围。结合影像组学数据,可以更精准地筛选出适合新辅助化疗的患者,改善患者预后。通过这种个性化的分层评估,患者的治疗方案将更符合实际情况,避免过度治疗或治疗不足的风险,提升治疗疗效和生存期。
本研究的主要优势包括:①采用影像组学特征结合机器学习回归建模,使得LNR 预测更加精准,而非仅限于淋巴结阳性/阴性的二分类;②结合临床因素创建预测模型,相比单纯影像组学提高了模型效能,且通过列线图实现预测结果的可视化,提高了临床应用价值;③系统评估了模型的区分能力和临床效用,确保了结果的可靠性。
尽管本研究取得了较为理想的结果,但仍存在一定局限性。首先,本研究基于回顾性数据,且样本量较小,可能存在选择偏倚。其次,影像组学特征的提取与分析受影像质量、扫描参数及手动分割的影响,标准化方法仍需进一步优化。最后,本研究缺乏外部验证,单中心的结论可能存在一定的外部有效性偏差。因此,未来需要通过多中心大样本的前瞻性研究进一步验证该模型的有效性和普适性。此外,未来可结合深度学习方法或多模态影像 (如PET⁃CT或MRI)进一步提升模型的预测能力。
本研究通过建立影像组学模型,成功获得可在术前预测患者LNR的列线图模型,对改善胃癌患者预后有一定价值,未来的工作将重点确认LNR在预测长期生存和其他临床结果方面的价值,并探索与其他生物标志物联合使用的可能性,以优化临床医生的术前决策。
利益冲突声明:
所有作者声明无利益冲突。
Conflict of Interests:
All the authors declare no conflict of interests.
作者贡献声明:
陈柃池、周乾正参与数据收集与文章撰写;李沣员、李琼参与数据收集与文章修改;徐皓完成胃癌手术,参与提供本文想法。
Author’s Contributions:
CHEN Lingchi and ZHOU Qianzheng participated in data collection and article writing;LI Fengyuan and LI Qiong were in⁃ volved in data collection and article revision;XU Hao performed the gastric cancer surgery and contributed to the conceptualiza⁃ tion of this paper.

