摘要:目的: 为了探索焦亡相关的基因在多囊卵巢综合征(Polycystic ovary syndrome,PCOS)发病机制中的作用;并构建PCOS的精确预测模型。方法: 为此,从基因表达综合数据库(Gene expression Synthesis,GEO)中获取了三个微小RNA(microRNA, mRNA)表达谱,并分析了PCOS患者与正常健康女性之间焦亡相关基因(Pyroptosis-related genes,PRGs)的表达差异。本研究采用了广义线性模型(Generalized linear model,GLM)、随机森林(Random forest,RF)、支持向量机(Support vector machine,SVM)和极限梯度提升(Extreme gradient boosting,XGB),这四种机器学习算法来识别疾病特征基因。并采用实时定量聚合酶链反应(Real-time quantitative polymerase chain reaction, RT-qPCR)法检测10例PCOS患者和10例正常健康女性血浆中特征基因的表达量。结果: 建立了基于PRGs的PCOS预测模型和列线图。XGB方法在使用两个独立数据集验证模型时显示出最高的准确性,决策曲线分析进一步支持了这一结果。一致聚类显示PCOS病例中有两个不同的亚组,组2比组1表现出更高的免疫浸润。差异表达分析鉴定两个亚型之间的差异表达基因(Differentially expressed genes,DEGs) ,并对模式基因进行富集分析。临床验证,含CARD结构域的凋亡相关斑点样蛋白(PYD and CARD domain containing,PYCARD)、黑素瘤缺乏因子2(Absent in melanoma 2,AIM2)、染色质修饰蛋白4B(Chromatin modif-ying protein 4B,CHMP4B)和NOD样受体蛋白2(NOD-like receptor family pyrin domain containing 2,NLRP2)在PCOS患者组中的表达量明显高于正常对照组,具有统计学差异,验证了基于PRGs的PCOS预测模型准确性。结论: 本研究为PCOS与焦亡之间的关系提供了初步的见解,并提出了PCOS的精确预测模型。