Page 54 - 南京医科大学学报自然科学版
P. 54
第43卷第9期
·1232 · 南 京 医 科 大 学 学 报 2023年9月
进行峰识别、峰提取、峰对齐和积分等处理,然后与 使用SIMCA软件(V16.0.2)构建PCA模型,将高通量
质谱数据库匹配进行物质注释。 的代谢数据降维,在无监督分类模式下展示样本的总
1.2.3 质量控制与数据处理 体分布趋势以及组间样本的差异程度 。正交⁃偏最
[16]
质量控制:非靶向代谢组学分析取所有样品的 小 二 乘 判 别 分 析(orthogonal⁃partial least squares⁃
等量上清混合成质控样品,在样本检测过程中插入 discriminant analysis,OPLS⁃DA):使用 SIMCA 软件
质控样本,通过对质控样本的出峰和响应情况进行 (V16.0.2)过滤掉代谢物中与分类变量不相关的正
分析,判断最终质谱信息采集的质量,实时监控仪 交变量,进行OPLS⁃DA建模进一步将组间差异可视
器稳定性进行过程质控;为排除在物质提取、检测 化,横坐标 t[1]P 表示第一主成分的预测主成分得
分析过程中的误差,对质控样本的相关性及内标响 分,展示样本组间差异,纵坐标t[1]O表示正交主成
应稳定性进行数据质控,相关性大于 0.8,内标的响 分得分,展示样本组内差异,第一主成分的变量投
应差异小于 15%,则认为系统稳定、数据质量高。 影重要度(variable importance in the projection,VIP)
靶向代谢组学分析取标准品混合溶液作为质控样本 代表代谢物在分组中的重要性 [17] 。差异代谢物筛
上机检测,标准品为600多种已知结构和质谱信息的 选:为避免只使用一类统计分析方法带来的假阳性
常见代谢物,其他质控方法步骤与非靶向代谢组学分 错误或模型过拟合,筛选VIP>1和t检验P < 0.05的
析一致。 代谢物为差异代谢物。生物标志物筛选:通过取
数据预处理:非靶向代谢组学分析是对所有代 GDM组和NC组差异倍数的以2为底的对数(log⁃fold
谢物的无偏检测,需对单个峰信号进行过滤以去除 change,LFC)评价代谢物在两组间表达水平的差异
噪音,再通过 HMDB 数据库和 KEGG 数据库匹配代 大小,取 LFC 绝对值最大的 5 种代谢物为备选生物
谢物,为避免检测的偶然性,剔除单组缺失值≥50% 标志物,以 ROC 曲线下面积(area under the curve,
及所有组中缺失值≥50%的代谢物数据,其余缺失 AUC)评价诊断精度。
值通过最小值乘以(0.1,0.5)间随机数进行填补,非
2 结 果
靶向代谢组学分析取代谢物峰面积与同位素内标
峰面积的比值为该代谢物在样本中的相对定量 2.1 研究对象的基线资料
值。靶向代谢组学分析则直接通过比对标准品的 研究对象的基线资料如表 2 所示,GDM 组的餐
质谱信息识别代谢物,缺失值剔除和填补方法同非 后 1 h 血糖和餐后 2 h 血糖均高于 NC 组,差异有统
靶向代谢组学分析,靶向代谢组学分析代谢物在样 计学意义,其他临床资料差异无统计学意义。
本中的绝对定量,通过目标代谢物标准品的标准曲 2.2 质量控制结果比较
线计算得出代谢物的浓度,单位为nmol/L。 两种方法的质控样品相关性均高于 0.99,显示
1.3 统计学方法 样本提取和制备质量较好(图 1A~C)。总离子流图
主成分分析(principal component analysis,PCA): 显示,内标在质控样品中的保留时间和响应强度稳
表2 研究对象的基线资料
Table 2 Baseline information of the study objects (x ± s)
指标 NC组(n=20) GDM组(n=20) t值 P值
年龄(岁) 029.15 ± 2.98 29.55 ± 2.91 -0.430 0.670
孕周(周) 025.63 ± 0.72 25.79 ± 0.95 -0.598 0.553
BMI(kg/m) 021.04 ± 1.48 20.65 ± 1.28 0.897 0.375
2
孕次(次) 001.45 ± 0.76 01.55 ± 0.83 -0.399 0.692
产次(次) 000.25 ± 0.44 00.20 ± 0.41 0.370 0.714
收缩压(mmHg) 107.75 ± 7.39 107.55 ± 10.51 0.070 0.945
舒张压(mmHg) 067.10 ± 8.42 66.95 ± 5.58 0.066 0.947
空腹血糖(mmol/L) 004.38 ± 0.27 04.50 ± 0.51 -0.884 0.382
餐后1 h血糖(mmol/L) 007.41 ± 1.36 09.64 ± 1.28 -5.328 <0.001
餐后2 h血糖(mmol/L) 006.72 ± 1.37 08.23 ± 1.37 -3.507 0.001
糖化血红蛋白(mmol/ L) 004.91 ± 0.19 04.86 ± 0.19 0.924 0.362