Page 128 - 南京医科大学学报自然科学版
P. 128
第41卷第9期
·1394 · 南 京 医 科 大 学 学 报 2021年9月
表2 两组各指标非参数检验(曼⁃惠特尼U检验)结果
指标 VTE组(n=274) 非VTE组(n=274) Z值 P值
年龄[岁,M(P25,P75 )] 056.00(50.00,64.00) 056.00(48.75,63.00) -0.323 0.747
体重[kg,M(P25,P75 )] 065.43(60.00,70.00) 063.00(59.00,70.00) -2.058 0.040
BMI[kg/m ,M(P25,P75 )] 025.26(23.44,26.41) 024.65(22.58,26.71) -1.563 0.118
2
患糖尿病(例) 000.09 000.07 -0.507 0.612
有手术史(例) 000.26 000.00 -5.220 <0.001
D⁃二聚体水平[ng/mL,M(P25,P75 )] 569.99(346.71,944.61) 319.82(221.37,427.31) -9.706 <0.001
脂蛋白[nmol/L,M(P25,P75 )] 045.00(20.75,74.00) 140.50(56.00,275.50) -9.182 <0.001
血浆蛋白C活性[%,M(P25,P75 )] 107.30(90.08,123.03) 112.40(101.85,127.50) -3.964 <0.001
血小板计数[×10 /L,M(P25,P75 )] 241.00(198.00,295.00) 252.00(213.00,284.50) -1.241 0.215
9
C⁃反应蛋白[mg/L,M(P25,P75 )] 004.00(2.00,7.00) 002.10(1.35,3.66) -6.373 <0.001
表3 Baseline模型预测结果 (n=500) 0.05,反映出该模型的拟合结果较为理想(表5)。
预测结果 预测正确
真实情况 表5 Logistic回归结果 (n=500)
患有VTE 未患VTE 率(%)
变量 系数 P值 Exp(B)
患有VTE 0 247 000.0
是否有手术史 -21.880 0.998 0.000
未患VTE 0 253 100.0
D⁃二聚体水平 0.003 <0.001 1.003
总准确率 050.6
脂蛋白 -0.003 <0.001 0.997
检验结果,所做的检验是分别将这些变量纳入方 血浆蛋白C活性 -0.025 <0.001 0.975
C⁃反应蛋白 0.082 0.024 1.085
程,检验方程的改变是否有统计学意义。在 P <
常量 23.258 0.998 1.261×10 10
0.001的显著性水平下,此检验结果有5个变量是显
著的。说明将是否有手术史、D⁃二聚体水平、脂蛋 将 48 个样本组成的测试集数据代入拟合得到
白、血浆蛋白C活性、C⁃反应蛋白这5个变量分别纳 的最终模型中去,衡量模型的预测能力。当计算所
入方程,方程的改变是有统计学意义的,且总的统 得概率大于或等于 0.5 时,即预测该患者患有 VTE,
计量也有统计学意义。 否则预测该患者未患VTE。模型的预测结果如表6
所示。在该测试集中,模型的预测结果较好,总准
表4 尚未纳入模型方程的变量及其比分检验结果 确 率 为 72.92% ,灵 敏 度 为 70.37% ,特 异 度 为
(n=500)
变量 分数 自由度 P值 76.20%。最后,再采用 k 折交叉验证的方式,取 k=
年龄 0.154 01 0.695 10,可 以 得 到 十 折 交 叉 验 证 的 平 均 准 确 率 为
体重 3.288 01 0.070 75.36%,说明模型在现有数据集上的稳健性较好,
BMI 2.824 01 0.093 泛化能力较强。
是否患糖尿病 0.096 01 0.757
表6 Logistic模型预测结果 (n=48)
是否有手术史 23.572 01 <0.001
预测结果 预测正确
D⁃二聚体水平 45.196 01 <0.001 真实情况
脂蛋白 27.232 01 <0.001 患有VTE 未患VTE 率(%)
患有VTE 19 08 70.37
血浆蛋白C活性 21.002 01 <0.001
未患VTE 05 16 76.20
血小板计数 5.650 01 0.017
总准确率 72.92
C⁃反应蛋白 18.001 01 <0.001
总统计量 117.721 10 <0.001
3 讨 论
逐步向前回归法是从表4中P值最小的变量开 本研究中样本年龄最小 28 岁,最大为 84 岁。
始,逐个将其纳入模型,以模型的极大似然函数值 因此,所选取的研究样本年龄范围分布较广且主要
最大为目标,以最后一步的入选变量作为最终结 人群为中年人(第一四分位数=49.00)。同时,根据
果。利用前向逐步回归进行变量筛选,得到最终的 WHO对于BMI的划分标准,18.5~<25.0 kg/m 为正常
2
2
回归模型。其中,最终模型的 H⁃L 检验 P=0.192> 范围,BMI≥25 kg/m 为超重。由于BMI的第一四分位