Page 92 - 《南京医科大学学报》自然科学版2026年第2期
P. 92
第46卷第2期
·248 · 南 京 医 科 大 学 学 报 2026年2月
while the remaining 103 cases served as a test set for external validation. Predictors were selected via the least absolute selection and
shrinkage operator(LASSO)method. Patients were randomly divided into training(n=414)and validation(n=177)sets. Ten machine
learning algorithms were employed to develop risk prediction models. Receiver operating characteristic(ROC)curves were plotted to
evaluate predictive performance. The calibration accuracy of model⁃predicted probabilities was assessed using calibration curves,while
decision curve analysis(DCA)was employed to quantify the clinical net benefit across varying decision thresholds. External validation
utilized the area under the curve(AUC)to assess the generalization capability of the optimal model. Shapley Additive exPlanations
(SHAP)were applied to rank variable importance. Results:The all⁃cause mortality rate was 42.6%(252/591). Among the 10 models,
the support vector machine(SVM)exhibited optimal performance,the AUC was 0.928,the sensitivity was 89.47%,and the accuracy
was 0.919,and the evaluation of calibration curve and DCA showed that the consistency and benefit of the model are still good ,
the Brier score of 0.089 indicates that the model demonstrates low predictive error and favorable calibration performance on the
internal validation dataset,suggesting its reliability in probabilistic forecasting. External validation yielded an AUC of 0.835,
indicating robust generalization capability of the model. The SHAP plot showed that the importance ranking of the influencing factors
for all⁃cause mortality was living alone,tunneled cuffed catheter(TCC),prealbumin,albumin,Charlson comorbidity index(CCI)score,
iPTH<300 pg/mL,age,junior high school education or lower,blood urea nitrogen⁃to⁃creatinine ratio,diabetic nephropathy,college
degree or higher education and sex. Conclusion:The SVM⁃based prediction model demonstrates robust performance in forecasting
all⁃cause mortality among MHD patients,facilitating early identification of high⁃risk individuals and supporting clinical decision⁃making.
[Key words] machine learning algorithms;hemodialysis;all⁃cause mortality;prediction model;validation
[J Nanjing Med Univ,2026,46(02):247⁃255]
维 持 性 血 液 透 析(maintenance hemodialysis, 城市建湖县人民医院血液透析中心2024年1—12月
MHD)作为主要的肾脏替代疗法,对于延长慢性肾 103例MHD患者。2017年1月—2023年12月591例
[1]
衰竭患者生命至关重要 。然而,研究表明,MHD MHD患者用于模型构建及内部验证,根据存活情况
患者预后存在诸多不确定性,心血管事件、感染、微 分为存活组(339例)和死亡组(252例),2024年1—
炎症状态等因素导致我国 MHD 患者全因死亡风险 12 月 103 例患者用于外部验证。纳入标准:①符合
较高,4年存活率远低于日本 [2-3] 。据不完全统计,截 慢性肾脏病防治指南(2022 年版) 中慢性肾脏病
[7]
至 2022 年底,我国有 84.4 余万例 MHD 患者 ,他们 5 期诊断标准且正在接受 MHD 治疗的患者;②接
[4]
面临着复杂的健康状况及多样化的医疗需求,如何 受规律透析≥3 个月;透析频次为 3 次/周,每次 4 h;
准确预测 MHD 患者的全因死亡风险对于提高患者 ③患者知情同意。排除标准:①正处于妊娠期;②同
生存质量和降低医疗成本具有重要意义。近年来, 时行腹膜透析;③精神异常不配合;④协变量存在
机器学习算法在临床领域展现出广泛的应用前景, 缺失。本研究通过无锡市第二人民医院、江南大学
其强大的数据分析能力能够揭示数据背后的隐藏 附属医院、无锡市第五人民医院、建湖县人民医院
模式与规律,为临床决策提供有力支持 [5-6] 。然而, 伦理委员会审查(编号:Y⁃5[2024])。
将机器学习算法应用于血液透析领域分析患者生 1.2 方法
存状况鲜见报道。因此,本研究旨在构建基于机器 1.2.1 资料收集
学习算法的MHD患者全因死亡预测模型,为医护制 经文献回顾、结合专家意见及临床情境自行设
定个性化治疗方案、改善患者生存状况及预后提供 计血液透析患者资料信息表,包括人口统计学资
科学依据。 料、临床基线资料、实验室检查。通过病例调查法、
电话问询及入户随访调查收集所有研究对象信
1 对象和方法
息。包括年龄、性别、文化程度、居住状况、血管通
1.1 对象 路、原发病、透析年限、体重指数(body mass index,
本研究为横断面研究,共纳入 694 例 MHD 患 BMI)、查尔森合并症指数(Charlson comorbidity index,
者,其中无锡市第二人民医院、江南大学附属医院、 CCI)、血红蛋白、白蛋白、前白蛋白、尿素氮肌酐比值、
无锡市第五人民医院3所三级甲等医院血液透析中 钙磷乘积、血钠、全段甲状旁腺素(intact parathyroid
心 2017 年 1 月—2023 年 12 月 591 例 MHD 患者,盐 hormone total,iPTH)、C反应蛋白、尿素清除指数(Kt/V)。

