Page 89 - 南京医科大学学报自然科学版
P. 89
第42卷第5期 韩 玉,何 薇,吴桢珍,等. 原发性肺腺样囊性癌及黏液表皮样癌的基因突变及表达谱系构建[J].
2022年5月 南京医科大学学报(自然科学版),2022,42(05):684-689 ·685 ·
在2015年版WHO 肺肿瘤分类中,肺涎腺肿瘤 针,捕获的文库与链霉亲和素磁珠结合,去除非特
包括腺样囊性癌(adenoid cystic carcinoma,ACC)、黏液 异性结合的文库。
表皮样癌(mucoepidermoid carcinoma,MEC)、上皮肌上 RNA建库:提取的RNA通过KAPA建库试剂盒
[1]
皮癌、多形性腺瘤 ,以前两者最常见。肺涎腺肿 进行处理,首先通过 RiboErase 去除核糖体核糖核
瘤生长常较慢,对于病灶局限的肿瘤组织,手术切 酸(ribosome ribonucleic acid,rRNA),进一步去除
除是首要治疗方式 ,但对于无法手术的患者,想要 RNA 样本中的 DNA 残留,利用纯化的 RNA 进行互
[2]
探究更多的治疗方案,需要对肺涎腺肿瘤的发生发 补脱氧核糖核酸(complementary deoxyribonucleic ac⁃
展机制有更深的研究,目前对肺涎腺肿瘤的报道主 id,cDNA)合成,进一步合成互补链,末端修复,接头
要包括一般情况、临床特征、预后,且多为个案报道 连接和文库扩增用于后续上机测序。RNA 部分检
和临床分析,在疾病发生、转移等机制方面的研究 测无富集流程。
较少。高通量测序,又称下一代测序(next genera⁃ 上机测序:按照 Hiseq 4000 使用说明准备测序
tion sequencing,NGS)能够准确检测被检测组织所 试剂,将表面标记的流式细胞上机测序;选用paired⁃
有的基因结果,且因其能快速、准确地检测而被广 end程序(基因片段采用桥式扩增法,而未经过环化
泛用于肿瘤患者的基因检测,具有检测量大、精确 的方式)进行双端测序,测序过程由Illumina提供的
度大的优势。本研究通过 NGS 检测技术从 DNA 及 数据收集软件进行控制,并进行实时数据分析取得
RNA两个层面对肺ACC、肺MEC进行全面分析。 原始测序序列,使用Q30(原始数据中测序碱基质量
数值大于30的碱基数量占总碱基数量的百分比)标
1 材料和方法
准去除达不到标准的碱基;去除PCR扩增过程中产
1.1 材料 生的重复数据。
研究纳入 2017 年 5 月—2020 年 7 月南京医科 1.2.2 生物信息学分析
大学第一附属医院、常州市第一人民医院、镇江市 DNA 生物信息学分析:测序下机数据为 bcl 格
第一人民医院共计 39 例患者,其中,ACC 14 例, 式,使用 bcf2fastq(v2.17.1.14,Illumina 公司)软件将
MEC 24 例,1例患者因病理不清在后续基因检测过 其转换为 FASTQ(版本:Illumina 1.8+)格式。通过
程中被剔除。本研究经南京医科大学第一附属医 Trimmomatic软件进行原始测序数据质控,去除低质
院伦理委员会批准(伦理审批号:2022⁃SR⁃254),患 量 reads(高通量测序仪产生的测序数据);通过
者经手术、支气管镜及经皮肺穿刺获取组织送检病 BWA 软 件(https://github.com/lh3/bwa/tree/master/
理前均已签署知情同意书,收集患者的肿瘤组织样 bwakit)将得到的 DNA 序列与人源基因组序列 hg19
本及可获取到的部分癌旁样本用于后续分析。所 比对。使用基因组分析工具包 GATK 3.4.0(https://
有病例的肺涎腺肿瘤均为原发。 software.broadinstitute.org/gatk/)进行插入缺失突变
1.2 方法 和碱基质量进行评分,用 VarScan2 检测体细胞突
1.2.1 组织基因检测 变。体细胞突变保留标准:对于在 COSMIC 数据库
采用 QIAGEN DNA 和 QIAGEN RNA 提取试剂 中报道超过 20 次的基因突变,最小突变丰度阈值
盒进行组织样本 DNA 及 RNA 的提取,实验操作流 (VAF)=1.0%,且至少有3根突变reads支持,对于其
程参照提取试剂盒说明书。分别对提取后的 DNA 他突变 VAF=2.0%,且至少有 5 根突变 reads 支持。
和 RNA 进行 Qubit 定量,其中 DNA 提取总量不低于 此外,所有突变还需要满足最小测序深度≥ 20,最小
200 ng,RNA提取总量不低于200 μg。 碱基质量≥25,reads 偏倚不大于 10%的标准。采用
DNA 建库富集:提取好的 DNA 样本经超声打 ANNOVAR 对单核苷酸多态性(SNP)和 Indel(插入/
断,末端修复、接头连接、纯化基因后Qubit 定量,选 缺失)注释,数据库:dbSNP(单核苷酸多态性数据
取片段化处理后平均大小 250~300 bp 的片段 DNA 库)(v137)、1 000Genome(千人基因组数据库)、Ex⁃
进入测序流程;对选择的片段进行 PCR 扩增及纯 AC(外显子组整合数据库)、COSMIC(癌症中体细胞
化、文库定量及 PCR 扩增效率计算构建测序文库。 突变目录)(v70)、ClinVAR和SIFT(尺度不变特征转
DNA 富集选择南京世和基因生物技术股份有限公 换)数据库。1000Genome 或 ExAC 项目中群体频率
司自研的 416 panel 进行肿瘤相关基因富集。将基 大于1%的突变被删除。进一步通过内部同一测序
因捕获探针与文库杂交,加入引物、杂交溶液、探 平台收集的随机测序错误数据库对得到的突变结