Page 91 - 《南京医科大学学报》自然科学版2026年第2期
P. 91

第46卷第2期                           南京医科大学学报(自然科学版)
                  2026年2月                   Journal of Nanjing Medical University(Natural Sciences)     ·247 ·


               ·临床研究·

                基于多种机器学习算法构建并验证维持性血液透析患者全因

                死亡风险预测模型



                王 娇 ,周怡君 ,孙文娟 ,周静怡 ,王依娜                  3*
                       1
                                                1
                               2
                                        1
                无锡市第二人民医院血液透析中心,江苏                无锡   214000;建湖县人民医院血液透析中心,江苏              盐城    224700;江南大学
                1                                             2                                         3
                附属医院血液透析中心,江苏 无锡             214122

               [摘   要] 目的:基于不同机器算法构建并验证维持性血液透析(maintenance hemodialysis,MHD)患者全因死亡预测模型。
                方法:收集江苏省4所医院血液透析中心共694例患者的临床资料,其中无锡市3所三级甲等医院血液透析中心在2017年1月—
                2023年12月有591例MHD患者,盐城市1所二级甲等医院血液透析中心在2024年1—12月有103例MHD患者。将591例研
                究对象以7∶3的比例随机分为训练集(n=414)和验证集(n=177),训练集用于构建模型,验证集用于内部验证;将103例研究对
                象作为测试集,用于外部验证。通过最小绝对值选择与收缩算子(least absolute selection and shrinkage operator,LASSO)方法筛
                选预测因子,采用10种机器学习算法构建MHD患者全因死亡风险预测模型,绘制受试者工作特征(receiver operating characteristic,
                ROC)曲线评估模型预测效果。运用校准曲线评估模型预测概率的准确性,决策曲线分析(decision curve analysis,DCA)评估模型
                在不同决策阈值下的临床净收益。外部验证采用ROC曲线下面积(area under curve,AUC)评价最优模型泛化能力,通过Shapley加
                法解释(Shapley additive exPlanations,SHAP)对各变量因素进行重要性排序。结果:MHD患者全因死亡发生率为42.6%(252/591),
                10种机器学习算法模型中,支持向量机(support vector machine,SVM)模型的预测效能最优,ROC曲线下AUC为0.928,灵敏度
                为89.47%,精确度为0.919,校准曲线、DCA评价预测模型一致性及获益性良好,Brier分数为0.089,表明模型在内部数据集上
                的预测误差较小,校准性能良好。外部验证AUC为0.835,说明模型具有较强的泛化能力。SHAP图显示全因死亡发生的影响
                因素重要性排序分别为独自居住、带涤纶套中心静脉导管(tunneled cuffed catheter,TCC)、前白蛋白、白蛋白、查尔森合并症指
                数(Charlson comorbidity index,CCI)评分、全段甲状旁腺激素(intact parathyroid hormone total,iPTH)<300 pg/mL、年龄、初中及以
                下学历、尿素氮肌酐比值、糖尿病肾病、大专及以上学历、性别。结论:基于SVM构建的维持性血液透析患者全因死亡预测模
                型具有良好的预测效果,有助于识别高风险患者,为临床决策及干预提供依据。
               [关键词] 机器学习算法;血液透析;全因死亡;预测模型;验证
               [中图分类号] R692.5                   [文献标志码] A                       [文章编号] 1007⁃4368(2026)02⁃247⁃09
                doi:10.7655/NYDXBNSN250166



                Development and validation of an all⁃cause mortality risk prediction model utilizing multiple
                machine learning algorithms for maintenance hemodialysis patients
                                                                1
                                                   1
                          1
                                      2
                WANG Jiao ,ZHOU Yijun ,SUN Wenjuan ,ZHOU Jingyi ,WANG Yina  3*
                1 Hemodialysis Center,Wuxi Second People’s Hospital,Wuxi 214000;Hemodialysis Center,Jianhu County People’s
                                                                          2
                                       3
                Hospital,Yancheng 224700;Hemodialysis Center,Affiliated Hospital of Jiangnan University,Wuxi 214122,China
               [Abstract] Objective:To construct and validate prediction models for all ⁃ cause mortality in maintenance hemodialysis(MHD)
                patients using diverse machine learning algorithms. Methods:Clinical data were collected from 694 patients across four hemodialysis
                centers in Jiangsu Province,including 591 MHD patients from three tertiary Grade A hospitals in Wuxi City(January 2017-December
                2023)and 103 patients from one secondary Grade A hospital in Yancheng City(January- December 2024). The 591 cases were
                randomly divided into a training set(n=414)and a validation set(n=177)at a 7∶3 ratio for model development and internal validation,


               [基金项目] 无锡市护理学会科研项目(Q202303);无锡市青年科技人才托举项目(TJXD⁃2024⁃210);江苏医药职业学院校本
                课题(20229JH35)
                通信作者(Corresponding author),E⁃mail:9862019217@jiangnan.edu.cn(ORCID:0009⁃0008⁃9722⁃7741)
                ∗
   86   87   88   89   90   91   92   93   94   95   96