-
肺癌是全球范围内最常见的恶性肿瘤,发病率和病死率居我国恶性肿瘤首位[1]。目前其主要外科手术治疗方式包括原发病灶切除及纵隔淋巴结清扫。在手术过程中若损伤胸导管主干及其分支或术后剧烈咳嗽使膈肌猛烈收缩而损伤胸导管,均易造成乳糜渗出,延长患者住院时间,如果大量乳糜液渗出则会直接压迫心肺,导致低氧血症、心律失常等,甚至危及患者生命[2-4]。因此对于乳糜漏的早期诊断、早期干预尤为重要。
-
目前临床对于乳糜漏的诊断仍依赖于肉眼观察,即当胸管引流液呈现典型乳白色变化才送胸水做乳糜试验阳性试验。本研究团队[5] 在前期研究中已证实术后第2天胸水乳糜定性试验阳性与临床乳糜胸发生情况之间存在显著相关,且淋巴结清扫范围、血清甘油三酯、术后白蛋白水平等是肺癌根治术后早期胸水乳糜定性试验阳性结果的独立危险因素,提示临床医护人员对术后第2天胸水乳糜定性试验阳性的人群应给予早期识别与干预措施,防止其病程发展。但该研究样本量较少,且单纯的影响因素分析并不具有预警作用。预警模型是结合多种危险因素预测患者预后的统计模型,能在术前对高危患者进行筛选[6]。目前常见的模型为Logistic回归模型、反向传播(back propagation,BP)神经网络模型、决策树模型,因此,本研究拟扩大样本量,分别比较3种不同预警模型对胸水乳糜阳性的预警效果,以筛选出最优模型,并在临床应用验证其效能。
-
1 对象和方法
-
1.1 对象
-
模型构建阶段:采用方便抽样的方法,纳入2018年1—12月在南京医科大学第一附属医院胸外科拟行肺癌手术治疗的患者。样本量计算依据前期调查胸水乳糜阳性率48.5%,规定可信区间为0.90,容许误差为5.5%,代入PASS 11软件得样本量达402例。纳入标准:年龄≥18岁;经术前活检或术中快速病理组织学诊断为肺癌,拟行肺部切除加淋巴结清扫术;既往无胸部手术史;自愿参加本研究。排除标准:诊断为肺癌伴全身转移无法手术或病历资料不完整的患者;术前诊断为营养不良或术后在重症监护室监护大于48h的患者;两侧肺叶均有结节拟行双侧同期手术者;围术期神志不清者。剔除标准:术后出血或持续漏气需要再次手术的患者;围术期内死亡或转院。
-
模型验证阶段:采用方便抽样的方法,前瞻性纳入2019年1—3月在南京医科大学第一附属医院胸外科拟行肺癌手术治疗的患者。样本量计算依据第一阶段预警模型观察变量数决定。按样本量为变量数5~10倍的基本原则,考虑20%的无效率。纳入、排除、剔除标准均与量表构建阶段相同。本研究经医院伦理委员会批准,所有入组患者均知情同意。
-
1.2 方法
-
对符合入选标准的患者由研究团队成员查阅患者病例填写一般资料调查表。一般资料调查表由研究者自行设定,包括住院号、年龄、性别、身高、体重指数(body mass index,BMI)等。于术后第2天填写手术与生理指标调查表,包括肿瘤性质、TNM分期、手术方式、淋巴结清扫范围、术前白蛋白、血清总胆固醇、血清甘油三酯水平等。同时留取胸水进行乳糜定性试验,并记录引流情况,包括每日胸水引流量、胸管拔除时间等。
-
1.3 统计学方法
-
利用EpiData3.1进行数据录入和初步整理;计数资料以频数表示,组间比较采用χ2 检验;通过SPSS 19.0软件构建Logistic回归模型;将经Logistic回归模型筛选后有意义的变量一起作为输入层代入多层感知器模块构建BP神经网络模型,输出节点数为2,隐含层激活函数为双曲正切,输出层激活函数为softmax。通过多次测试不同隐含层节点数下的受试者工作特征(receiver operating characteristic,ROC) 曲线下面积(area under curve,AUC),选取最优结果并得出此时各变量重要性;将所有变量代入SPSS 19.0决策树模块,语法选择SQL、树增长方式选择CHAID。选用Medcalc软件比较3个模型AUC,以确定最优模型。最后在模型验证阶段通过计算灵敏度、特异度、阳性预警值、阴性预警值和总体正确率来判断模型的预警效能。P <0.05为差异有统计学意义。
-
2 结果
-
2.1 一般资料
-
共收集712例患者资料,其中剔除12例(5例持续漏气、4例术后转入ICU治疗时间超过48h、3例术后出血剔除),最终纳入700例,其中334例(47.7%) 术后第2天胸水乳糜阳性,366例(52.8%)阴性。在纳入分析的11个因素中,年龄、BMI、肿瘤T分期、肿瘤N分期、淋巴结清扫方式、肿瘤性质、肺切除范围、术后白蛋白、胸水甘油三酯在两组间差异具有统计学意义(P <0.05,表1)。
-
2.2 肺癌根治术后患者胸水乳糜试验阳性Logistic回归模型构建
-
将单因素分析中有意义(P <0.05)的变量进行基于最大似然比的逐步回归法的二元Logistic回归,最终进入方程的变量有年龄、BMI、肿瘤T分期、肿瘤N分期、淋巴结清扫方式、肺切除范围、术后白蛋白和胸水甘油三酯(表2)。构建的ROC曲线AUC为0.854,95%CI为0.826~0.882,P< 0.001。采用Youden指数衡量最佳临界点,Youden指数最大值0.570,此时灵敏度86.3%,特异度70.7%。此时乳糜阳性预测正确率为73.7%,总预测正确率76.6%。
-
2.3 肺癌根治术后患者胸水乳糜试验阳性BP神经网络模型构建
-
将变量纳入SPSS 19.0多层感知器模块,即输入层输入8个变量。因样本量较少且有研究表明,一个隐含层的BP神经网络可以很好地反映数据规律和特征,因此本研究隐含层数选择1,隐含层激活函数为双曲正切,输出层激活函数为softmax。随机分配70%的数据为训练集,30%为测试集。当节点数为6时AUC最大,此时AUC为0.980,95%CI为0.967~0.989,显著性水平P< 0.001。Youden指数最大值0.842,此时灵敏度90.2%,特异度94.0%。测试集乳糜阳性预测正确率为96.4%,总预测正确率93.5%。各自变量重要性见表3,经标准化后的预测变量重要性排序见图1。结果显示重要性由大到小排序依次是胸水甘油三酯、BMI、肺切除范围、肿瘤N分期、术后白蛋白、年龄、淋巴结清扫发生、肿瘤T分期。
-
2.4 肺癌根治术后患者胸水乳糜试验阳性决策树模型构建
-
将纳入的11个因素作为自变量,语法选择SQL、树增长方式选择CHAID。最终进入模型的变量依次为胸水甘油三酯、肺切除范围、术后白蛋白、肿瘤部位(图2)。构建的ROC曲线下面积为0.835, 95%CI为0.805~0.862,显著性水平 P< 0.001。Youden指数最大值0.513,灵敏度65.0%,特异度86.2%。此时,乳糜试验预测正确阳性率为86.2%,总预测正确率75.1%。
-
图2 肺癌根治术后患者胸水乳糜试验阳性决策树模型
-
2.5 3种模型比较
-
3种模型预测乳糜阳性准确率和AUC见表4,结果显示3种模型都能有效预测胸水乳糜阳性(P< 0.05)。3种模型AUC见图3。通过Medcalc对3种模型的AUC进行两两比较,结果显示,BP神经网络模型与决策树模型及Logistic回归模型的AUC差异有统计学意义(Z=9.510,P <0.001;Z=11.410,P < 0.001)。因此,将BP神经网络模型选为最优模型。
-
2.6 肺癌根治术后患者胸水乳糜试验阳性预警模型验证
-
验证阶段,使用BP神经网络模型进行胸水乳糜试验结果预测,共纳入患者131例,预测术后第2天胸水乳糜试验阳性患者67例,其中62例患者实际乳糜试验检测为阳性;预测术后第2天阴性患者64例,其中57例实际乳糜试验检测为阴性。灵敏度89.9%、特异度91.9%、阳性预测值92.5%、阴性预测值89.1%、总正确率90.8%。
-
图3 3种模型ROC比较
-
3 讨论
-
本团队前期研究已证实早期留取胸水行乳糜定性试验方便快捷且对预警乳糜漏的发生是有意义的,本研究再次证实了术后早期乳糜阳性发生率仍较高,占调查总人数的47.7%,而乳糜阳性患者发生乳糜胸率高于阴性患者。近年来,随着胸腔镜手术的开展,术后肉眼可见乳糜漏的发生率也在不断上升,可达6.7%[7-8]。因此医务人员应考虑将术后早期乳糜定性试验纳入肺癌术后常规观察指标,将阳性患者视为乳糜漏高危人群,加强针对性的动态监测。本研究也证实了术后早期胸水乳糜阳性受患者自身生理因素和手术因素的共同作用,指出对于年龄≥41岁、BMI>23.9kg/m2、肿瘤分期处于中晚期、术中淋巴结清扫范围超过6个站点、术中切除肺段及以上的范围、术后低蛋白、高甘油三酯的患者应予以重视,与现有乳糜胸影响因素研究结果基本一致。江南、侯建国等[9-10] 在肺癌、食管癌术后乳糜胸研究中均指出BMI、肿瘤类型、转移浸润程度、手术方式和癌灶切除程度等为主要的影响因素,但学者们同样指出糖尿病、急性呼吸窘迫综合征等基础疾病也是乳糜胸的影响因素。国外文献较于国内,虽数量较少但更有针对性,Li等[11] 指出体表面积> 1.69m2 是非小细胞肺癌行胸腔镜下肺叶切除术患者术后乳糜胸发生的独立影响因素。
-
预测模型是结合多种危险因素来预计个体在特定时间段内出现或将出现特定结果的绝对概率或风险[12],Logistic模型、决策树和人工神经网络作为构建预测模型常用的方法,可提高模型中所储备知识的数量和质量,特别是可以提取相似实例之间的相似性和不同类之间的差别,更有效地解决医学中模糊的、不确定的信息,特别适合于医学模式分类与判断,被应用于疾病的诊断和并发症的预测[13-14]。在肺癌根治术后患者胸水乳糜阳性方面,现有影响因素分析均不具有预警作用,为弥补此问题,本研究团队建立了3种预警模型,并筛选出了最优模型。本研究发现BP神经网络预警效能优于决策树模型与Logistic回归模型,而决策树模型和Logistic回归模型两者间差异并不具有统计学意义。BP神经网络模型是目前应用最多的神经网络,具有强大的非线性映射能力,但BP神经网络模型同时也存在过拟合和对影响因素解释程度较低等问题[15-16]。本研究为提高模型性能,分别设置训练集和测试集,同时在Logistic回归模型的基础上进行BP神经网络模型构建,保证了变量的可解释性。进入模型的各自变量重要性大小依次是胸水甘油三酯、BMI、肺切除范围、肿瘤N分期、术后白蛋白、年龄、淋巴结清扫发生、肿瘤T分期,符合现阶段影响因素研究结果。同时,经临床实际验证,证实了本研究构建的模型预测乳糜阳性的准确率高达90%,具有良好的预警效能,可在临床推广使用。
-
临床现阶段对于肺癌术后采取统一的营养支持方案及低脂饮食,但具体的饮食方案尚不清晰,且是否所有患者均需在住院期间持续低脂饮食还有待进一步研究。同时关于乳糜胸患者饮食也尚未形成统一方案,国内外学者均一致认为术后乳糜胸患者在保守治疗期间,应予以低脂、高蛋白、高热量、高碳水化合物饮食,但具体饮食要求各学者意见不一[17-18]。杜娜等[19] 的肺癌术后短期中链甘油三酯饮食方案在临床实验性应用初见成效,但该研究也未划分高危人群、实行分级饮食。本研究构建的预警模型,可及早筛选出乳糜阳性高危人群,从而作为分级饮食的依据,指导围术期营养管理模式的构建。
-
本研究在模型构建和验证阶段,选择的样本集中在江苏省一家三甲医院,代表性有限。在纳入因素中,因考虑临床实际使用,未纳入手术时间、术中失血等手术相关变量以及非常规测量的实验室指标,信息的全面性尚不足。
-
肺癌根治术后早期胸水乳糜阳性发生率高,受手术和个人生理指标共同作用。依据BP神经网络构建的乳糜阳性预警模型科学严谨、具有良好的预测效能,可早期筛选高危人群,指导肺癌患者围术期营养管理模式的构建。
-
参考文献
-
[1] CHEN W,ZHENG R,BAADE P D,et al.Cancer statis⁃tics in China,2015[J].CA Cancer J Clin,2016,66(2):115-132
-
[2] BRYANT A S,MINNICH D J,WEI B,et al.The Incidence and management of postoperative chylothorax after pulmo⁃ nary resection and thoracic mediastinal lymph node dis⁃ section[J].Ann Thorac Surg,2014,98(1):232-237
-
[3] 李捷,孙玉鹗.肺切除术后肺切除术后乳糜胸的诊断和治疗[J].中华外科杂志,2003,41(9):713
-
[4] 谢博雄,丁嘉安,陈晓峰,等.肺切除术后乳糜胸的临床诊治[J].中华胸心血管外科杂志,2005,21(5):301
-
[5] 李方,曹娟,杨丹丹,等.肺癌术后患者早期胸水乳糜试验结果及影响因素分析[J].南京医科大学学报(自然科学版),2020,40(8):1218-1221
-
[6] EJAZ A,SCHMIDT C,JOHNSTON F M,et al.Risk fac⁃ tors and prediction model for inpatient surgical site infec⁃ tion after major abdominal surgery[J].J Surg Res,2017,217:153-159
-
[7] 薛佳金.肺癌根治术后乳糜胸的治疗[D].杭州:浙江大学,2011
-
[8] ASSUMPCAO L,CAMERON J L,WOLFGANG C L,et al.Incidence and management of chyle leaks following pancreatic resection:a high volume single⁃center institu⁃ tional experience[J].J Gastrointest Surg,2008,12(11):1915-1923
-
[9] 江南,钱如林,张恒.肺癌手术乳糜胸发生和治疗的相关因素分析[J].江苏医药,2013,39(11):1344-1345
-
[10] 侯建国,石力伟,赵现军,等.食管癌术后乳糜胸的相关危险因素及治疗措施[J].现代肿瘤医学,2017,25(7):82-85
-
[11] LI S,WANG Y,ZHOU K,et al.Body surface area as a novel risk factor for chylothorax complicating video⁃assist⁃ ed thoracoscopic surgery lobectomy for non ⁃ small cell lung cancer[J].Thorac Cancer,2018,9(12):1741-1753
-
[12] VENABLES W N.An introduction to statistical inference and its applications with R by TROSSET,M.W[J].Bio⁃ metrics,2010,66(2):656-657
-
[13] 胡灵芝.数据挖掘方法及其在医学领域中的应用[J].辽宁中医药大学学报,2010,12(7):51-52
-
[14] 朱凌云,吴宝明.医学数据挖掘的技术、方法及应用 [J].生物医学工程学杂志,2003,20(3):189-192
-
[15] DUAN X,YANG Y,TAN S,et al.Application of artificial neural network model combined with four biomarkers in auxiliary diagnosis of lung cancer[J].Med Biol Eng Com⁃ put,2016,55(8):1-10
-
[16] PERGIALIOTIS V,POULIAKIS A,PARTHENIS C,et al.The utility of artificial neural networks and classification and regression trees for the prediction of endometrial can⁃ cer in postmenopausal women[J].Public Health,2018,164:1-6
-
[17] MCGRATH E E,BLADES Z,ANDERSON P B.Chylotho⁃ rax:aetiology,diagnosis and therapeutic options[J].Respir Med,2010,104:1-8
-
[18] NAIR S K,PETKO M,HAYWARD M P.Aetiology and management of chylothorax in adults[J].Eur J Cardiotho⁃ rac Surg,2007,32:362-369
-
[19] 杜娜,饶志勇,车国卫,等.肺癌术后短期中链甘油三酯饮食临床效果的前瞻性随机研究[J].中国肺癌杂志,2016,19(12):821-826
-
摘要
目的:建立肺癌术后胸水乳糜阳性自动预警模型并评价其预警效能。方法:纳入2018年1—12月在南京医科大学第一附属医院胸外科拟行肺癌手术治疗的患者700例,收集一般资料、术后生理相关指标、胸水引流情况等,通过单因素分析、 多因素分析筛选出术后胸水乳糜试验阳性的独立危险因素,构建Logistic回归模型、反向传播(back propagation,BP)神经网络模型、决策树模型,并通过Medcalc软件比较三者受试者工作特征(receiver operating characteristic,ROC)曲线下面积,以选取最优模型,纳入2019年1—3月在南京医科大学第一附属医院胸外科拟行肺癌手术治疗的患者131例进行模型验证,并在模型验证阶段通过计算灵敏度、特异度、阳性预警值、阴性预警值和总体正确率来判断模型的预警效能。结果:Logistic 回归模型、BP 神经网络模型、决策树模型的曲线下面积分别为0.854、0.980、0.835,其中BP神经网络模型为最优模型,差异具有统计学意义。最终模型共纳入8个变量,重要性由大到小依次为胸水甘油三酯、体重指数、肺切除范围、肿瘤N分期、术后白蛋白、年龄、 淋巴结清扫方式、肿瘤 T 分期。通过验证其灵敏度 89.9%、特异度 91.9%、阳性预测值 92.5%、阴性预测值 89.1%、总正确率 90.8%。结论:BP神经网络构建的乳糜阳性预警模型科学严谨,具有良好的预测效能,可早期筛选高危人群,为肺癌患者围术期营养管理模式的构建奠定基础。