Page 93 - 《南京医科大学学报》自然科学版2026年第2期
P. 93
第46卷第2期 王 娇,周怡君,孙文娟,等. 基于多种机器学习算法构建并验证维持性血液透析患者全因死亡
2026年2月 风险预测模型[J]. 南京医科大学学报(自然科学版),2026,46(2):247-255 ·249 ·
1.2.2 分组 多层感知器(multilayer perceptron,MLP)这 10 种算
将591例研究对象以7∶3的比例随机分为训练 法在训练集中构建维持性血液透析患者全因死亡
集(n=414)和验证集(n=177),训练集用于构建模 预 测 模 型 。 绘 制 受 试 者 特 征(receiver operating
型,验证集用于内部验证;将103例研究对象作为测 characteristic,ROC)曲线并计算曲线下面积(area
试集,用于外部验证。 under the curve,AUC)评估模型效能,F1评分评估敏
1.3 统计学方法 感性。在测试集中对最优模型进行外部验证,采用
采用 SPSS 23.0 和 R 软件(R 4.2.2)进行统计分 AUC值评估模型的泛化能力。双侧检验,检验水准
析。正态分布的连续变量以均数±标准差(x ± s)表 为0.05。
示,组间比较采用独立样本t检验;非正态分布的连
2 结 果
续型变量用中位数(四分位数)[M(P25,P75)]表示,
方差不齐时用 Mann⁃Whitney U 检验进行组间比 2.1 临床资料比较
较。计数资料以例数(百分比)[n(%)]表示,组间比 591 例 MHD 患者,根据存活情况分为存活组
较采用卡方检验。将所有预测因子纳入 LASSO 回 (339 例)和死亡组(252 例),死亡发生率为 42.6%
归分析进行变量筛选,再分别采用Logistic回归分析、 (252/591)。死亡组患者的年龄、独自居住者占
支持向量机(support vector machine,SVM)、随机森林 比、CCI 评分、尿素氮肌酐比值和 C 反应蛋白水平
(random forest,RF)、K 最近邻(K⁃nearest neighbors, 高于存活组,死亡组患者的血红蛋白、白蛋白和
KNN)、决策树(decision tree,DT)、极端梯度提升 前白蛋白水平低于存活组,差异均有统计学意义
(extreme gradient boosting,XGBoost)、朴素贝叶斯(naive (P 均<0.05)。此外,两组患者在文化程度、血管通
Bayes,NB)、线性判别分析(linear discriminant analysis, 路类型、原发病种类、BMI、iPTH 构成方面差异有统
LDA)、梯度提升机(gradient boosting machine,GBM)、 计学意义(P均<0.01,表1)。
表1 患者临床资料比较
Table 1 Comparison of clinical characteristics of patients
2
Indicator Survival group(n=339) Deceased group(n=252) t/χ /Z P
Age[years,M(P25,P75 )] 61.00(50.00,70.00) 69.00(62.00,77.00) 7.839 <0.001
Sex[n(%)] 1.372 0.242
Male 206(60.77) 165(65.48)
Female 133(39.23) 087(34.52)
Education level[n(%)] 39.403 <0.001
Junior high school or below 197(58.11) 196(77.78)
High school or technical school 097(28.61) 054(21.43)
College degree or above 045(13.27) 02(0.79)
Living arrangement[n(%)] 39.640 <0.001
Living alone 27(7.96) 102(40.48)
Cohabitating 312(92.04) 150(59.52)
Vascular access type[n(%)] 78.998 <0.001
AVF 290(85.55) 136(53.97)
TCC 043(12.68) 114(45.24)
AVG 06(1.77) 02(0.79)
Primary disease[n(%)] 10.735 0.005
Chronic glomerulonephritis 147(43.36) 084(33.33)
Diabetic nephropathy 079(23.30) 088(34.92)
Other 113(33.33) 080(31.75)
Duration of dialysis[years,n(%)] 3.871 0.277
≤ 5 177(52.21) 114(45.24)
>5-10 133(39.23) 0108(42.86)

