Page 33 - 《南京医科大学学报(自然科学版)》2025年第9期
P. 33

第45卷第9期      王韫格,刘云龙,王玲菲,等. 宿主DNA甲基化标志物在宫颈癌筛查中的应用:ZNF671的关键贡献与
                  2025年9月             联合模型评价[J]. 南京医科大学学报(自然科学版),2025,45(9):1242-1250                   ·1245 ·


                predictive value,NPV)等重要指标。                       况,结果显示随病变程度加重,甲基化水平总体呈
                1.3.2  预测模型构建与评估                                  上升趋势,部分组间差异具有统计学意义。具体而
                    数据分组:按 7∶3 比例将数据集划分为训练集                       言,SOX1、JAM3 和 DLX1 在高级别组织学组与癌症
                和测试集,使用固定随机种子(n=742)以保证实验                         组之间的DNA甲基化水平有显著差异,而在低级别
                的可重复性。对于训练集和测试集的基线数据差                             与高级别组织学组之间的差异没有统计学意义;相
                异,首先进行正态性检验,正态分布变量采用独立                            反,ZNF671 在低级别与高级别组织学组之间的
                样本 t 检验,非正态分布变量采用 Mann⁃Whitney U                  DNA 甲基化水平差异显著,但高级别组织学组与
                检验,分类变量则使用卡方检验或Fisher精确检验。                        癌症组之间的差异未达到显著水平。Jonckheere⁃
                    特征筛选与建模:采用逐步 Logistic 回归进行                    Terpstra 检验结果表明宿主基因甲基化水平随疾病

                变量筛选,并以赤池信息准则(Akaike information                  严重程度均表现出单调递增的趋势(P < 0.001),为
                criterion,AIC)作为模型选择标准,选择最具预测价                    其作为潜在筛查标志物提供了生物学证据。
                值的变量,避免引入多余噪声和冗余特征。                               2.3  单个宿主基因标志物在CIN1-与CIN2+中诊断
                    模型评估与比较:为保证分析的严谨性,使用                          效果
                建模时划分的训练集和测试集,对单独或联合的宿                                与 4 级病理分组分析结果不同,图 2 基于临床
                主基因甲基化标志物进行ROC曲线分析,并根据各                           常用的 CIN1-/CIN2+二分类分组,部分宿主基因在
                自标志物的训练集生成的截断值对测试集分析,分                            不同分组策略下的显著性表现存在差异。与CIN1-
                别报告模型的重要指标。                                       组相比,CIN2+组中 SOX1(9.08% vs. 5.71%)、JAM3
                                                                 (4.94% vs. 3.14% )、ZNF671(6.95% vs. 4.00% )和
                2 结    果
                                                                  DLX1(12.34% vs. 9.2%)的甲基化水平均显著升高,
                2.1  患者一般资料                                       差异具有统计学意义(P < 0.001),提示这些基因的
                    表2列出了患者的一般资料,本研究共纳入141例                       甲基化升高与 CIN2+病变密切相关,在二分类分析
                HPV16/18 阳 性 受 试 者 ,其 中 CIN1- 组 91 例              中显示出更强的区分能力。
               (64.54%),CIN2+组 50 例(35.46%),两组的年龄分                    使用 ROC 曲线进一步评估单个宿主基因在区
                布无显著差异(P=0.158)。在整个研究队列中,                         分CIN2+组与CIN1-组之间的诊断能力。结果如图
                HPV16阳性101例,HPV18阳性40例。其中,CIN1-                   3 所示,ZNF671 在 CIN2+诊断中表现出最好的诊断
                组中 HPV16 占 70.33%,HPV18 占 29.67%;CIN2+组           效果,其 AUC 为 0.741(0.646~0.836)。根据 AUC 的
                HPV16 占比为 74.00%,HPV18 占比为 26.00%。两               高低,单个宿主基因标志物在 CIN2+诊断中的效果
                组 HPV 亚型分布差异无统计学意义(P=0.644),表                     排序为:ZNF671、JAM3、DLX1、SOX1。
                明 单 纯 依 赖 HPV16/18 感 染 状 态 无 法 有 效 区 分                其他诊断性能评价指标结果如表 3 所示,每个
                CIN2+。                                            宿主基因标志物对 CIN2+的诊断特异度较好,但灵
                               表2 患者一般资料                          敏度较低。其中,JAM3 的诊断特异度最高,为
                      Table 2 General characteristics of patients  0.923,并获得了最优的 PPV(0.767)。而 ZNF671 则
                                          Category                获得了最优的 NPV(0.790)。这 4 个生物标志物均
                    Characteristic                         P
                                   CIN1-(n=91) CIN2+(n=50)        表现出良好的准确度。
                Age(years,x ± s)   42.23 ± 11.71 45.30 ± 9.49 0.158  2.4  单独或联合宿主基因甲基化标志物对 CIN2+
                HPV genotyping[n(%)]                     0.644    诊断效果的比较
                  HPV16             64(70.33)  37(74.00)
                                                                      本研究以 7∶3 的比例划分训练集与测试集,其
                  HPV18             27(29.67)  13(26.00)
                                                                  中训练集包含99例样本,测试集包含42例样本,训
                2.2  单个宿主基因标志物甲基化水平随宫颈病变                          练集与测试集在年龄、病理分类等基线特征间无统
                等级增加显著增加                                          计学差异。
                    本研究共纳入正常样本69例,低级别组织学样                             通过逐步 Logistic 回归构建联合宿主基因标志
                本 22 例,高级别组织学样本 34 例,癌症样本 16 例。                   物的CIN2+筛查模型。如表4所示,最终选择SOX1、
                图1展示了4个宿主基因在不同病理等级(正常、低                           ZNF671作为宿主联合甲基化标志物面板,后称联合
                级别、高级别、癌症)中的 DNA 甲基化水平分布情                         模型,此时 AIC 值为 106.62。为所有候选模型中最
   28   29   30   31   32   33   34   35   36   37   38