Page 93 - 《南京医科大学学报》自然科学版2026年第2期
P. 93

第46卷第2期        王  娇,周怡君,孙文娟,等. 基于多种机器学习算法构建并验证维持性血液透析患者全因死亡
                  2026年2月              风险预测模型[J]. 南京医科大学学报(自然科学版),2026,46(2):247-255                    ·249 ·


                1.2.2  分组                                         多层感知器(multilayer perceptron,MLP)这 10 种算
                    将591例研究对象以7∶3的比例随机分为训练                        法在训练集中构建维持性血液透析患者全因死亡
                集(n=414)和验证集(n=177),训练集用于构建模                      预 测 模 型 。 绘 制 受 试 者 特 征(receiver operating
                型,验证集用于内部验证;将103例研究对象作为测                          characteristic,ROC)曲线并计算曲线下面积(area
                试集,用于外部验证。                                        under the curve,AUC)评估模型效能,F1评分评估敏
                1.3  统计学方法                                        感性。在测试集中对最优模型进行外部验证,采用
                    采用 SPSS 23.0 和 R 软件(R 4.2.2)进行统计分             AUC值评估模型的泛化能力。双侧检验,检验水准
                析。正态分布的连续变量以均数±标准差(x ± s)表                        为0.05。
                示,组间比较采用独立样本t检验;非正态分布的连
                                                                  2 结    果
                续型变量用中位数(四分位数)[M(P25,P75)]表示,
                方差不齐时用 Mann⁃Whitney U 检验进行组间比                     2.1  临床资料比较
                较。计数资料以例数(百分比)[n(%)]表示,组间比                            591 例 MHD 患者,根据存活情况分为存活组
                较采用卡方检验。将所有预测因子纳入 LASSO 回                        (339 例)和死亡组(252 例),死亡发生率为 42.6%
                归分析进行变量筛选,再分别采用Logistic回归分析、                     (252/591)。死亡组患者的年龄、独自居住者占
                支持向量机(support vector machine,SVM)、随机森林            比、CCI 评分、尿素氮肌酐比值和 C 反应蛋白水平
               (random forest,RF)、K 最近邻(K⁃nearest neighbors,      高于存活组,死亡组患者的血红蛋白、白蛋白和
                KNN)、决策树(decision tree,DT)、极端梯度提升                 前白蛋白水平低于存活组,差异均有统计学意义
               (extreme gradient boosting,XGBoost)、朴素贝叶斯(naive   (P 均<0.05)。此外,两组患者在文化程度、血管通
                Bayes,NB)、线性判别分析(linear discriminant analysis,    路类型、原发病种类、BMI、iPTH 构成方面差异有统
                LDA)、梯度提升机(gradient boosting machine,GBM)、        计学意义(P均<0.01,表1)。


                                                      表1 患者临床资料比较
                                         Table 1 Comparison of clinical characteristics of patients

                                                                                                  2
                           Indicator              Survival group(n=339)  Deceased group(n=252)  t/χ /Z       P
                Age[years,M(P25,P75 )]            61.00(50.00,70.00)     69.00(62.00,77.00)     7.839     <0.001
                Sex[n(%)]                                                                       1.372      0.242
                  Male                                206(60.77)             165(65.48)
                  Female                              133(39.23)             087(34.52)
                Education level[n(%)]                                                          39.403     <0.001
                  Junior high school or below         197(58.11)             196(77.78)
                  High school or technical school     097(28.61)             054(21.43)
                  College degree or above             045(13.27)             02(0.79)
                Living arrangement[n(%)]                                                       39.640     <0.001

                  Living alone                        27(7.96)               102(40.48)
                  Cohabitating                        312(92.04)             150(59.52)
                Vascular access type[n(%)]                                                     78.998     <0.001
                  AVF                                 290(85.55)             136(53.97)
                  TCC                                 043(12.68)             114(45.24)
                  AVG                                 06(1.77)               02(0.79)
                Primary disease[n(%)]                                                          10.735      0.005
                  Chronic glomerulonephritis          147(43.36)             084(33.33)
                  Diabetic nephropathy                079(23.30)             088(34.92)
                  Other                               113(33.33)             080(31.75)
                Duration of dialysis[years,n(%)]                                                3.871      0.277
                  ≤ 5                                 177(52.21)             114(45.24)
                  >5-10                               133(39.23)            0108(42.86)
   88   89   90   91   92   93   94   95   96   97   98