Page 19 - 《南京医科大学学报》自然科学版2026年第2期
P. 19
第46卷第2期 杨 玥,葛 愿,李明辉,等. 基于机器学习的心脏术后衰弱预测模型的构建与验证[J].
2026年2月 南京医科大学学报(自然科学版),2026,46(2):173-180,187 ·175 ·
白水平。 布的计量资料采用均数±标准差(x ± s)表示,组间比
1.2.2 患者术后衰弱的评估与分组 较采用独立样本t检验;偏态分布数据以中位数(四
依据《老年心血管疾病合并衰弱评估与管理中 分位数)[M(P25,P75)]表示,组间比较采用 Mann⁃
国专家共识》推荐,采用 FRAIL 量表评估心脏疾病 Whitney U 检验;计数资料以频数(百分比)[n(%)]
患者的衰弱状态。该量表耗时较短、客观且重复性 描述,组间比较采用χ 检验。使用“randomForest”
2
好,目前在许多心血管疾病的研究中表现出优异的 “glmnet”和“xgboostR”等 R 包进行机器学习分析;
评估性能 [12-14] 。FRAIL量表共包含5个条目,如果患 “pROC”包 计 算 ROC 值 ,“ggplot2”包 绘 制 图 片 ;
者有 3 个及以上的回答为“是”,则可诊断为衰弱。 “rms”包进行预测模型验证和列线图构建及验证;
评估选择在术后 1 个月左右,患者门诊复查时进 “ggDCA”包分析临床决策曲线。双侧检验,P < 0.05
行。该时间点的选择基于以下考量:①避开了住院 为差异有统计学意义。
期间急性手术应激、疼痛以及麻醉药物影响的急性
2 结 果
期,能更真实地反映患者中期的恢复趋势;②此时
患者常规进行随访,避免电话随访带来不准确性; 2.1 患者基线特征
③术后1~3个月是评估心脏手术后中期并发症与功 训练集及内部验证集纳入235例患者,按照7∶3
能恢复的关键时间窗口,有学者也采用术后1个月设 的比例随机分为训练集165例,验证集70例。训练
为评估衰弱的第一个正式随访点 。FRAIL评分≥3分 集与验证集的基线特征比较显示,各组间变量分布
[15]
者纳入衰弱组,FRAIL评分<3分者纳入非衰弱组。 均衡,无显著差异(表1)。在训练集中,44例患者发
1.2.3 基于机器学习的变量筛选 生衰弱,发生率为26.7%。单因素分析显示,衰弱组
采用最小绝对收缩和选择算子(least absolute 与非衰弱组在年龄、糖尿病、LVDd、LVEF 及白蛋白
shrinkage and selection operator,LASSO)、随机森林 水平上差异均有统计学意义(P均 < 0.05,表2)。
(random forest,RF)以 及 极 限 梯 度 提 升(extreme 2.2 机器学习结果
gradient boosting,XGBoost)3种机器学习算法筛选共 LASSO模型(AUC为0.795,95%CI:0.698~0.892)
同预测因子。所有模型均使用 10 折交叉验证进行 在λ.1se 下选择了 7 个非零系数变量(图 2A~D),
评估。RF模型使用500棵决策树训练,通过平均下 XGBoost 模型(AUC 为 0.839,95%CI:0.757~0.921,
降Gini指数对变量重要性进行排序,保留前10个最 图 2E~G)以及 RF 模型(AUC=0.838,95%CI=0.756~
重要变量。对于LASSO回归,通过二项式惩罚将非 0.920,图2H~J)则分别根据变量重要性排序选取前
信息变量压缩至零系数,使用最小准则和 1 个标准 10个特征。3种机器学习方法共同筛选出4个关键
误规则选择最优正则化参数;将λ.1se准则下系数非 变量,包括年龄、术前白蛋白、术前 LVEF 和 LVDd
零的变量视为显著预测因子。在 XGBoost 中,计算 值,其方差膨胀系数(variance inflation factor,VIF)均
沙 普 利 加 和 解 释(Shapley additive explanation, 远小于 4,表明这些预测因子之间不存在显著的多
SHAP)以量化各变量对模型预测的贡献度,并选择 重共线性,确保了模型估计的稳定性和结果的可靠
按增益排序的前 10 个变量。最终通过韦恩图可视 性(图2K)。
化3种方法确定共同变量。 2.3 列线图构建与验证
1.2.4 列线图构建 将上述 4 个因子纳入 Logistic 回归,构建列线
基于 3 种机器学习方法确定的共同变量,构建 图模型。每个因素都可以查询到 1 个分数,通过将
Logistic回归模型以开发列线图,作为个体化风险预 4 个分数相加并在总评分轴上定位总和来计算
测的可视化工具。采用受试者工作特征(receiver 总分和(图 3)。该列线图在训练集和内部验证
operating characteristic,ROC)曲线及其曲线下面积 数 据 集 中 均 表 现 出 稳 健 的 预 测 性 能 。 训 练 集
(area under the curve,AUC)评估模型的区分度、校 AUC 为 0.846(95%CI:0.763~0.928),最大约登指
准曲线评估模型的一致性、决策曲线分析(decision 数 对 应 的 临 界 值 为 0.247,校 准 曲 线 Brier 值 为
curve analysis,DCA)评估该模型的临床价值,并在 0.144。将训练集模型置于内部验证集中进行验证,
内部验证集以及时间分层验证集中予以验证。 内部验证集 AUC 为 0.821(95%CI:0.701~0.940),最
1.3 统计学方法 大约登指数对应的临界值为 0.315,校准曲线 Brier
使用 RStudio 4.4.2 进行统计分析,符合正态分 值为 0.131。

