Page 39 - 南京医科大学自然版
P. 39

第45卷第10期         杜凯豪,侯立朝,东小鸽,等. 幽门螺杆菌与食管癌的因果关联:基于孟德尔随机化研究[J].
                 2025年10月                    南京医科大学学报(自然科学版),2025,45(10):1404-1416                      ·1407 ·


                                                            Confounding
                                                              Factor
                                        Assumption 2
                                  Instrumental
                                              Assumption 1   Exposure                  Outcome
                                    variable
                                                          Assumption 3
                                                       图1   两样本MR模型
                                             Figure 1 Model of the two⁃sample MR analysis

                性。GWAS 的数据根据 HapMap3 参考资料进行筛                      ST003739合并后的数据未通过Steiger检验)。使用
                选,调整次要等位基因频率(minor allele frequency,              PhenoScanner数据库   [18] 检索相关混杂(参数设置为:
                MAF),确保MAF值正确反映了较小的频率,确保等                         P=1×10 ,proxies=None,r =0.8,build=37),去除 ebi⁃a⁃
                                                                         -5
                                                                                        2
                位基因标识符只包含标准的核苷酸碱基A、C、G、T,                         GCST90018841 和 ebi ⁃ a ⁃ GCST003739 中高血压    [19]
                排除非 SNP 变异和重复的 SNP,排除缺失 P 值和效                    (rs12899909)、ieu⁃b⁃4960中酒精 (rs7207400)等混
                                                                                               [20]
                应大小的数据,确保效应方向与参考等位基因一                             杂SNP。将剩余数据进行MR⁃PRESSO检验,去除离
                致,确保A1和A2与参考基因型匹配,排除不匹配的                          群 SNP。由于 IV 的个数不能<3 个,否则无法进行
                数据。LDSC 通过考察检验统计量与连锁不平衡                           MR 分析,因此本研究删除 ieu⁃b⁃4960 与 ukb⁃b⁃531
               (linkage disequilibrium,LD)之间的关联来量化由真              合并后的数据(只有 2 个 IV)。进行多效应检验(图
                正的多基因信号或偏差所引起膨胀的贡献                     [14] 。该    5~7),未发现具有多效性的数据,多效性检验后剩
                方法可以从GWAS 摘要统计数据评估遗传相关性,                          下的SNP纳入最终的IV。
                并且不受样本重叠的偏见影响              [15] 。从性状1的每个          2.2  MR分析结果
                变异位点的 z 分数与性状 2 的每个变异位点的 z 分                          根据异质性选择固定效应模型或者随机效应
                数相乘,由此得到的遗传协方差将这一乘积对 LD                           模型,由于进行了多次假设性检验,其结果的假阳
                分数进行回归估计         [16] 。通过 SNP⁃遗传度归一化的             性率偏高,因此本研究还进行了结果的假阳性发现
                遗传协方差代表遗传相关性。P < 0.05为差异有统                        率(false discovery rate,FDR)矫 正(图 5~7),最 终
                计学意义,是遗传相关性的潜在证据。                                 IVW 法发现ieu⁃b⁃4905与ebi⁃a⁃GCST90018841之间
                    MR 的主要目的是为了找出可能的因果关系,                         的正相关性无论是在FDR矫正前还是矫正后都具有
                当两个性状之间的遗传相关性较高(即 P < 0.05),                      统计学意义(P < 0.05),但ieu⁃b⁃4905与ieu⁃b⁃4960之
                这可能提示两个研究的性状在遗传水平上存在相                             间在 FDR 矫正前后却不存在有统计学意义的因果
                互影响或共享一些遗传因素,这可能导致MR分析中                           关联上。与此同时 ebi⁃a⁃GCST90006914 与 ebi⁃a⁃
                的“遗传混杂”。P > 0.05意味着在统计上两个研究的                      GCST003739之间在FDR 矫正前具有统计学意义但
                性状之间没有显示出显著的遗传相关性。在这种情                            矫正后其负相关性无统计学意义。其余数据的MR
                况下,使用MR方法揭示其中一个性状对另一个性状                           分析结果均无统计学意义。5 种 MR 分析方法结果
                可能有因果影响时,结果更具说服力,因为较低的遗                           详见图8。
                                                [17]
                传相关性可以减少遗传混杂的可能性 。                                2.3  敏感性分析
                                                                      Cochran’s Q检验结果的异质性详见图5~7。根
                2  结 果
                                                                  据异质性本研究选择不同的 IVW 效应模型,P >
                2.1  IV的选择结果                                      0.05 时选择固定效应模型,反之选择随机效应模
                                                       -5
                    首先,设置暴露的强关联性 P < 1.0×10(图 2~                  型。MR⁃PRESSO 均显示 P > 0.05,即不存在离群值
                4),然后去除存在LD的IV(r =0.001,kb=10 000),计              的影响。MR Egger回归截距显示不存在多效性(图
                                         2
                算其 F 值(均>10),并提取结局数据进行合并,去除                       5~7)。散点图、漏斗图、森林图、“留一法”分析均显
                回文SNP(action=2),去除结局P<1×10 的SNP以降                 示结果稳健(图9)。
                                                  -5
                低假阳性风险,为避免反向因果的干扰,去除Steiger                       2.4 贝叶斯加权MR
                检验不通过的 SNP(其中 ukb⁃b⁃531 与 ebi⁃a⁃GC⁃                   贝叶斯加权 MR 显示 ieu⁃b⁃4905 与 ebi⁃a⁃GC⁃
   34   35   36   37   38   39   40   41   42   43   44