Page 54 - 南京医科大学学报自然科学版
P. 54

第43卷第9期
               ·1232 ·                           南 京    医 科 大 学 学         报                        2023年9月


              进行峰识别、峰提取、峰对齐和积分等处理,然后与                           使用SIMCA软件(V16.0.2)构建PCA模型,将高通量
              质谱数据库匹配进行物质注释。                                    的代谢数据降维,在无监督分类模式下展示样本的总
              1.2.3 质量控制与数据处理                                   体分布趋势以及组间样本的差异程度 。正交⁃偏最
                                                                                                 [16]
                  质量控制:非靶向代谢组学分析取所有样品的                          小 二 乘 判 别 分 析(orthogonal⁃partial least squares⁃
              等量上清混合成质控样品,在样本检测过程中插入                            discriminant analysis,OPLS⁃DA):使用 SIMCA 软件
              质控样本,通过对质控样本的出峰和响应情况进行                            (V16.0.2)过滤掉代谢物中与分类变量不相关的正
              分析,判断最终质谱信息采集的质量,实时监控仪                            交变量,进行OPLS⁃DA建模进一步将组间差异可视
              器稳定性进行过程质控;为排除在物质提取、检测                            化,横坐标 t[1]P 表示第一主成分的预测主成分得
              分析过程中的误差,对质控样本的相关性及内标响                            分,展示样本组间差异,纵坐标t[1]O表示正交主成
              应稳定性进行数据质控,相关性大于 0.8,内标的响                         分得分,展示样本组内差异,第一主成分的变量投
              应差异小于 15%,则认为系统稳定、数据质量高。                          影重要度(variable importance in the projection,VIP)
              靶向代谢组学分析取标准品混合溶液作为质控样本                            代表代谢物在分组中的重要性                [17] 。差异代谢物筛
              上机检测,标准品为600多种已知结构和质谱信息的                          选:为避免只使用一类统计分析方法带来的假阳性
              常见代谢物,其他质控方法步骤与非靶向代谢组学分                           错误或模型过拟合,筛选VIP>1和t检验P < 0.05的
              析一致。                                              代谢物为差异代谢物。生物标志物筛选:通过取
                  数据预处理:非靶向代谢组学分析是对所有代                          GDM组和NC组差异倍数的以2为底的对数(log⁃fold
              谢物的无偏检测,需对单个峰信号进行过滤以去除                            change,LFC)评价代谢物在两组间表达水平的差异
              噪音,再通过 HMDB 数据库和 KEGG 数据库匹配代                      大小,取 LFC 绝对值最大的 5 种代谢物为备选生物
              谢物,为避免检测的偶然性,剔除单组缺失值≥50%                          标志物,以 ROC 曲线下面积(area under the curve,
              及所有组中缺失值≥50%的代谢物数据,其余缺失                           AUC)评价诊断精度。
              值通过最小值乘以(0.1,0.5)间随机数进行填补,非
                                                                2  结 果
              靶向代谢组学分析取代谢物峰面积与同位素内标
              峰面积的比值为该代谢物在样本中的相对定量                              2.1  研究对象的基线资料
              值。靶向代谢组学分析则直接通过比对标准品的                                  研究对象的基线资料如表 2 所示,GDM 组的餐
              质谱信息识别代谢物,缺失值剔除和填补方法同非                            后 1 h 血糖和餐后 2 h 血糖均高于 NC 组,差异有统
              靶向代谢组学分析,靶向代谢组学分析代谢物在样                            计学意义,其他临床资料差异无统计学意义。
              本中的绝对定量,通过目标代谢物标准品的标准曲                            2.2  质量控制结果比较
              线计算得出代谢物的浓度,单位为nmol/L。                                 两种方法的质控样品相关性均高于 0.99,显示
              1.3  统计学方法                                        样本提取和制备质量较好(图 1A~C)。总离子流图
                  主成分分析(principal component analysis,PCA):      显示,内标在质控样品中的保留时间和响应强度稳

                                                    表2  研究对象的基线资料
                                           Table 2 Baseline information of the study objects           (x ± s)
                         指标                   NC组(n=20)           GDM组(n=20)            t值            P值
                  年龄(岁)                       029.15 ± 2.98        29.55 ± 2.91       -0.430          0.670
                  孕周(周)                       025.63 ± 0.72        25.79 ± 0.95       -0.598          0.553
                  BMI(kg/m)                   021.04 ± 1.48        20.65 ± 1.28        0.897          0.375
                         2
                  孕次(次)                       001.45 ± 0.76        01.55 ± 0.83       -0.399          0.692
                  产次(次)                       000.25 ± 0.44        00.20 ± 0.41        0.370          0.714
                  收缩压(mmHg)                   107.75 ± 7.39       107.55 ± 10.51       0.070          0.945
                  舒张压(mmHg)                   067.10 ± 8.42        66.95 ± 5.58        0.066          0.947
                  空腹血糖(mmol/L)                004.38 ± 0.27        04.50 ± 0.51       -0.884          0.382
                  餐后1 h血糖(mmol/L)             007.41 ± 1.36        09.64 ± 1.28       -5.328         <0.001
                  餐后2 h血糖(mmol/L)             006.72 ± 1.37        08.23 ± 1.37       -3.507          0.001
                  糖化血红蛋白(mmol/ L)             004.91 ± 0.19        04.86 ± 0.19        0.924          0.362
   49   50   51   52   53   54   55   56   57   58   59