Page 91 - 《南京医科大学学报》自然科学版2026年第2期
P. 91
第46卷第2期 南京医科大学学报(自然科学版)
2026年2月 Journal of Nanjing Medical University(Natural Sciences) ·247 ·
·临床研究·
基于多种机器学习算法构建并验证维持性血液透析患者全因
死亡风险预测模型
王 娇 ,周怡君 ,孙文娟 ,周静怡 ,王依娜 3*
1
1
2
1
无锡市第二人民医院血液透析中心,江苏 无锡 214000;建湖县人民医院血液透析中心,江苏 盐城 224700;江南大学
1 2 3
附属医院血液透析中心,江苏 无锡 214122
[摘 要] 目的:基于不同机器算法构建并验证维持性血液透析(maintenance hemodialysis,MHD)患者全因死亡预测模型。
方法:收集江苏省4所医院血液透析中心共694例患者的临床资料,其中无锡市3所三级甲等医院血液透析中心在2017年1月—
2023年12月有591例MHD患者,盐城市1所二级甲等医院血液透析中心在2024年1—12月有103例MHD患者。将591例研
究对象以7∶3的比例随机分为训练集(n=414)和验证集(n=177),训练集用于构建模型,验证集用于内部验证;将103例研究对
象作为测试集,用于外部验证。通过最小绝对值选择与收缩算子(least absolute selection and shrinkage operator,LASSO)方法筛
选预测因子,采用10种机器学习算法构建MHD患者全因死亡风险预测模型,绘制受试者工作特征(receiver operating characteristic,
ROC)曲线评估模型预测效果。运用校准曲线评估模型预测概率的准确性,决策曲线分析(decision curve analysis,DCA)评估模型
在不同决策阈值下的临床净收益。外部验证采用ROC曲线下面积(area under curve,AUC)评价最优模型泛化能力,通过Shapley加
法解释(Shapley additive exPlanations,SHAP)对各变量因素进行重要性排序。结果:MHD患者全因死亡发生率为42.6%(252/591),
10种机器学习算法模型中,支持向量机(support vector machine,SVM)模型的预测效能最优,ROC曲线下AUC为0.928,灵敏度
为89.47%,精确度为0.919,校准曲线、DCA评价预测模型一致性及获益性良好,Brier分数为0.089,表明模型在内部数据集上
的预测误差较小,校准性能良好。外部验证AUC为0.835,说明模型具有较强的泛化能力。SHAP图显示全因死亡发生的影响
因素重要性排序分别为独自居住、带涤纶套中心静脉导管(tunneled cuffed catheter,TCC)、前白蛋白、白蛋白、查尔森合并症指
数(Charlson comorbidity index,CCI)评分、全段甲状旁腺激素(intact parathyroid hormone total,iPTH)<300 pg/mL、年龄、初中及以
下学历、尿素氮肌酐比值、糖尿病肾病、大专及以上学历、性别。结论:基于SVM构建的维持性血液透析患者全因死亡预测模
型具有良好的预测效果,有助于识别高风险患者,为临床决策及干预提供依据。
[关键词] 机器学习算法;血液透析;全因死亡;预测模型;验证
[中图分类号] R692.5 [文献标志码] A [文章编号] 1007⁃4368(2026)02⁃247⁃09
doi:10.7655/NYDXBNSN250166
Development and validation of an all⁃cause mortality risk prediction model utilizing multiple
machine learning algorithms for maintenance hemodialysis patients
1
1
1
2
WANG Jiao ,ZHOU Yijun ,SUN Wenjuan ,ZHOU Jingyi ,WANG Yina 3*
1 Hemodialysis Center,Wuxi Second People’s Hospital,Wuxi 214000;Hemodialysis Center,Jianhu County People’s
2
3
Hospital,Yancheng 224700;Hemodialysis Center,Affiliated Hospital of Jiangnan University,Wuxi 214122,China
[Abstract] Objective:To construct and validate prediction models for all ⁃ cause mortality in maintenance hemodialysis(MHD)
patients using diverse machine learning algorithms. Methods:Clinical data were collected from 694 patients across four hemodialysis
centers in Jiangsu Province,including 591 MHD patients from three tertiary Grade A hospitals in Wuxi City(January 2017-December
2023)and 103 patients from one secondary Grade A hospital in Yancheng City(January- December 2024). The 591 cases were
randomly divided into a training set(n=414)and a validation set(n=177)at a 7∶3 ratio for model development and internal validation,
[基金项目] 无锡市护理学会科研项目(Q202303);无锡市青年科技人才托举项目(TJXD⁃2024⁃210);江苏医药职业学院校本
课题(20229JH35)
通信作者(Corresponding author),E⁃mail:9862019217@jiangnan.edu.cn(ORCID:0009⁃0008⁃9722⁃7741)
∗

