摘要
目的:基于临床及超声特点构建预测模型,以鉴别超声非平行位生长、乳腺影像报告和数据系统(Breast Imaging Reporting and Data System,BI-RADS)分为4A、4B类乳腺小肿块的良恶性,并评估其应用价值。方法:回顾性分析2020年6月— 2024年5月在南京医科大学第一附属医院就诊的327例乳腺肿块患者,筛选超声诊断为BI-RADS 4A、4B类,非平行位生长、直径≤10 mm的肿块,按7∶3的比例随机分为训练集(n=229)和验证集(n=98)。应用Logistic回归分析鉴别乳腺良、恶性肿块的风险因素并构建诊断预测模型。以受试者工作特征(receiver operating characteristic,ROC)曲线和决策曲线分析(decision curve analysis,DCA)评估模型的鉴别效能和临床意义。结果:327例患者中恶性比例为36.1%(118/327)。经单因素和多因素Logistic 回归分析,年龄、边缘、弹性和超声BI-RADS分类为恶性肿块的独立危险因素。纳入这4个变量建立诊断模型,并以列线图的形式展现。训练集和验证集ROC的曲线下面积分别为0.846和0.798;DCA证实应用模型预测肿块良恶性风险可以使患者获益。此外,基于列线图计算的风险评分对所有患者进行危险分层,风险评分≥0.7(后20%)的患者被列为高危组;风险评分≤0.1 (前20%)的患者被列为低危组,低、高危组恶性率分别为8.8%和82.1%。结论:根据临床及超声特点构建的预测模型,可有效鉴别超声BI-RADS 4A、4B类非平行位乳腺小肿块的良恶性。根据列线图计算风险评分进行危险分层,低危组的恶性率仅 8.8%,而高危组的恶性率为82.1%,具有较高的临床价值。
Abstract
Objective:To develop a predictive model based on clinical and ultrasound characteristics for differentiating between benign from malignant small breast masses with non-parallel growth and classified by the Breast Imaging Reporting and Data System(BI -RADS)as BI-RADS 4A and 4B,and to evaluate its application value. Methods:For this retrospective study,327 patients with breast masses were recruited in the First Affiliated Hospital of Nanjing Medical University from June 2020 to May 2024. These patients were screened and diagnosed with BI-RADS 4A and 4B classifications by ultrasound,with non-parallel growth and a diameter of ≤10 mm. They were randomly divided into a training set(n=229)and a validation set(n=98)at the ratio of 7∶3. Logistic regression analysis was used to identify risk factors for differentiating benign from malignant breast lesions and to construct a diagnostic predictive model. The effectiveness of the model was evaluated by the receiver operating characteristic(ROC)curve and the decision curve analysis(DCA). Results:Among the 327 cases,36.1%(118/327)were malignant. Univariate and multivariate logistic regression analyses identified age,margin,elasticity assessment,and US-BI - RADS classification as independent risk factors for malignant masses. A diagnostic model incorporating these four variables was established and presented as a nomogram. The area under curve(AUC)of the ROC was 0.846 and 0.798 for the training and validation sets,respectively. DCA confirmed that the model’s prediction of the risk of benign and malignant masses could benefit patients. Moreover,risk stratification based on nomogram-calculated risk scores for all patients showed that those with risk scores ≥0.7(top 20%)were classified as high-risk,while those with scores ≤0.1(bottom 20%)were classified as low-risk,with malignant rates of 8.8% and 82.1%,respectively. Conclusion:The predictive model constructed based on clinical and ultrasound characteristics effectively differentiates benign from malignant small breast masses of BI-RADS 4A and 4B categories with non-parallel growth. Risk stratification based on nomogram-calculated risk scores indicates a malignant rate of only 8.8% in the low-risk group and 82.1% in the high-risk group,demonstrating significant clinical value.
Keywords
根据美国放射学会在 2013 年发布的第 5 版乳腺影像报告和数据系统(Breast Imaging Reporting and Data System,BI⁃RADS),超声BI⁃RADS分类标准中4类肿块的亚分类没有明确的客观依据,很大程度上依赖于医师经验[1-2]。4A及4B类的恶性率范围为2%~50%,属于中低危险乳腺病变,在各大指南中均建议行活组织检查以明确性质。而在实际临床工作中,相当大比例的4A、4B类肿块活检后证实为良性病变,不仅增加了治疗费用,更不可避免地造成患者焦虑,甚至产生相关并发症。因此,对4A及 4B类患者进一步危险分层十分必要,以降低活检的假阳性率。
乳腺肿块最长轴与皮肤之间的方位,包括平行位和非平行位两种,是超声BI⁃RADS分类中描述肿块特征的重要参数。以往多项研究已经证实非平行位生长对恶性肿块有较高预测价值,甚至非平行位生长也是乳腺癌患者预后较差的独立危险因素[3-5]。因此在实际临床工作中,超声医师常常会将非平行位乳腺肿块诊断为BI⁃RADS 4类,导致后续的活检或手术。但是,有研究发现常规超声对小肿块的诊断效能低于大肿块,并且非平行方位在预测小肿块良恶性方面无统计学意义[6]。
因此,本研究旨在构建一个新的预测模型来鉴别非平行生长的乳腺小肿块的良恶性,对其中诊断为BI⁃RADS 4A及4B类的肿块进行危险分层,以期制定更优的临床决策以减少不必要的活检。
1 对象和方法
1.1 对象
本研究回顾性纳入2020年6月—2024年5月在南京医科大学第一附属医院接受诊断及治疗的327例乳腺肿块患者。纳入标准:①女性乳腺肿块患者,超声BI⁃RADS分类为4A类或4B类;②超声图像清晰,肿块为非平行位生长,最长径≤10 mm;③病理诊断明确。排除标准:①超声检查前接受肿块活检; ②有乳腺或其他器官恶性肿瘤病史;③同侧乳腺有活检或手术史。本研究获得南京医科大学第一附属医院伦理委员会的同意(伦理号:2024⁃SR⁃720)。鉴于本研究为回顾性研究,研究对象的知情同意予以豁免。
1.2 方法
1.2.1 资料收集
收集327例患者的一般资料,包括:①年龄及月经状态;②病理诊断,病理学分级,分子分型和淋巴结受累情况。
1.2.2 超声诊断
超声检查所用的仪器为 MyLab Twice(百胜公司,意大利)和Acuson Sequoia(西门子公司,德国),均配备高分辨率的线阵高频探头。超声检查包括常规二维超声(2D),彩色多普勒成像和弹性成像。当同侧乳腺存在多个肿块时,选取恶性可能最大的一个用于分析。基于Adler分级系统评估血供分布 (无血供、内部血供、边缘血供)和血流信号(0级、1 级、2级、3级)。采用压力式弹性成像方式,对图像进行5分法评估肿块硬度。1分和 2 分定义为质地偏软,3 分定义为质地中等,4 分和 5 分定义为质地偏硬。两位乳腺超声诊断经验超过 5 年及 15 年的医师分别回顾了所有图像,并根据美国放射学会制定的2013版BI⁃RADS分类标准进行评估,评估者对患者的临床病史、其他影像学资料和病理结果不知情。记录所有肿块的超声特征,包括最长径、内部回声、形态、边缘、后方回声、钙化、血供分布、血流分级、弹性评分以及BI⁃RADS分类。
1.3 统计学方法
数据使用 R 软件(版本 4.3.2)分析。分类变量采用卡方检验进行分析,连续变量采用Student t检验进行分析。通过单因素及多因素分析进行变量筛选,P <0.05 的变量将纳入后续分析。通过强制纳入回归构建预测模型,并且绘制受试者工作特征 (receiver operating characteristic,ROC)曲线以评估模型的预测能力。同时,绘制列线图对预测模型进行展示,校准曲线和 Hosmer⁃Lemeshow 检验评估模型预测结果与实际之间的差异。决策曲线分析预测模型的临床意义。基于预测模型的风险评分,将研究对象进行危险程度分组,推导预测模型的公式。使用双侧统计分析,P <0.05 为差异有统计学意义。
2 结果
2.1 研究对象基本特征
本研究共纳入 327 例女性患者,年龄(47.5± 11.2)岁。使用统计软件按 7∶3的比率随机将所有研究对象分为训练集(n=229)和验证集(n=98)。所有患者中恶性比例为36.1%(118/327),其中训练集队列恶性比例为 36.2%(83/229),验证集队列为 35.7%(35/98)。327个肿块的超声BI⁃RADS分类中, 4A 类 212 例,4B 类 115 例。恶性比例分别为 20.8% (44/212)和 64.3%(74/115)。两个数据集的基本特征差异无统计学意义(表1)。
2.2 恶性肿块相关特征的筛选
表2展示了对训练集队列的229例患者进行的单因素及多因素分析。在单因素分析中,恶性肿块患者中年龄偏大及绝经后患者的比例较良性肿块患者更高(P <0.001)。在超声图像特征中,恶性肿块相比良性肿块更多地表现为边缘不光整(P <0.001)及质地偏硬(P=0.001);BI⁃RADS分类中4B类明显多于 4A 类(P <0.001)。经多因素分析,年龄 (OR=1.05,95%CI:1.00~1.11,P=0.036),边缘(OR= 4.28,95% CI:1.67~12.33,P=0.004),弹性(OR=6.44, 95% CI:1.90~26.72,P=0.005)和BI⁃RADS分类(OR= 5.77,95% CI:2.76~12.50,P <0.001)仍然为恶性肿块的独立危险因素。
2.3 列线图的构建与验证
年龄、边缘、弹性和超声BI⁃RADS分类这4个变量被纳入统计并建立了诊断模型,以列线图的形式展现出来(图1)。训练集和验证集ROC的曲线下面积分别为0.846和0.798(图2A、D)。从校准曲线可以看出预测结果与实际结果之间较好的一致性, Hosmer⁃Lemeshow检测在训练集和验证集中P值均>0.05,显示模型良好的校准(图2B、E)。决策曲线分析显示,使用诊断模型预测乳腺肿块恶性风险比 “全部治疗”或“不治疗”策略增加了更多的净收益 (图2C、F)。
2.4 列线图对肿块良恶性的风险分层
基于诊断模型的列线图计算了所有患者的风险评分,前20%(风险评分界值为0.1)和后20%(风险评分界值为0.7)被设定为截断值。风险评分≥0.7 的患者被列为高危组,风险评分≤0.1的患者被列为低危组,其余患者被列为中危组。从图3可以看出,低危组中,8.8%(5/57)为恶性病变,91.2%(52/57)为良性病变;高危组中,良、恶性肿块的比例分别为 17.9%(10/56)和82.1%(46/56)。
3 讨论
本研究回顾性分析了327例超声诊断为BI⁃RADS 4A及4B类的非平行位生长乳腺小肿块的临床及声像特点,结果提示年龄、边缘、弹性和BI⁃RADS分类为恶性肿块的独立危险因素。利用这4个变量建立了预测模型,并以列线图的形式展现。根据列线图计算得出的风险评分将乳腺肿块进行了危险分层,其中低危组、高危组的恶性比例分别为 8.8%和 82.1%。
在以往大多数研究中,通常用纵横比>1指代非平行位,即肿块的前后径大于水平径,但是根据最新版的BI⁃RADS辞典,圆形及斜行于皮肤的肿块也属于非平行位生长,这导致了实际临床应用中的困难以及更多假阳性病例的出现[7]。有研究者对肿块最长轴与皮肤之间的角度(方位角)进行了量化,相比传统的纵横比>1的定义,更加准确并且客观,有效预测了恶性肿块[8]。本研究中的方位通过主观判断,尽管评估的医师诊断经验丰富,但是一些偏倚仍无法避免。希望在未来的研究中通过客观计算方位角来提高诊断模型的预测效能。
直径较小的乳腺肿块一直是常规超声的诊断难点,尤其对于<1 cm的肿块,超声特征不典型是主要原因。因此,很多研究联合弹性成像或超声造影等新技术来提高小肿块的诊断准确率[9-11]。通过本研究亦可发现,弹性成像中恶性肿块相比良性肿块质地偏硬,这与既往多数研究结果一致[12-13]。有研究者发现在<1 cm 的乳腺肿块良恶性鉴别中,边缘是唯一有意义的预测因子[6],本研究中,边缘也是有统计学意义的恶性相关危险因素。同时,相比钼靶及增强核磁,超声对边缘的判断更加准确,因此在临床中有较高的应用价值[14]。
表1训练集和验证集的临床和超声特征的比较
Table1Comparison of clinical and ultrasound features between the training and validation sets
BI⁃RADS 4类尤其是中低危险度的4A、4B类乳腺肿块,其临床处理一直是一项棘手问题,有创性活检可以早期发现恶性肿瘤,但是也同时给患者带来焦虑及额外医疗费用。因此目前有许多研究开发了多种方式来构建诊断模型对BI⁃RADS 4类肿块进行再分类,包括影像组学和人工智能[15-18],以减少假阳性病例。而本研究聚焦于超声中非平行位生长的小肿块,根据查阅文献所知,这是目前唯一对这一类结节展开的研究。本研究所构建的预测模型诊断效能较高,AUC可达0.846。诊断模型仅包含 4个变量,即年龄、弹性、边缘和BI⁃RADS 分类,易于在临床中推广使用。本研究另进行了危险分层,对于高危组,恶性率高达 82.1%,建议立即活检或手术,而对于低危组,由于恶性率仅8.8%,建议密切影像学随访。
表2基于训练集的单因素和多因素Logistic回归分析
Table2Univariate and multivariate logistic regression analysis of the training set
本研究亦存在一些不足之处。首先,这是一个回顾性研究,并且只纳入了病理确诊的患者,但大多数BI⁃RADS 4A类患者在实际临床中选择了随访观察,因此导致本研究的选择偏倚,以及较高的总体恶性率和较小的样本量。其次,本研究是单中心研究,BI⁃RADS分类也与本中心的医师经验相关,因此增加外部队列的验证能提升模型的普适性及临床实用性。
图1基于训练集构建的列线图模型
Figure1Nomogram to predict the malignancy based on the training set
图2预测模型的鉴别效能及临床意义评估
Figure2Evaluation of the effectiveness of the predictive model
综上,本研究回顾性分析了超声BI⁃RADS 4A及 4B类的非平行位生长的乳腺小肿块,基于临床及超声特点构建了诊断预测模型。同时,进一步对乳腺肿块进行了危险分层并提出诊疗建议,对于低危患者,可采取密切的影像学随访,而对于高危患者,建议行活检或手术治疗。
图3根据风险评分对肿块的危险分层
Figure3The risk classification performance of the nomogram in all patients
利益冲突声明:
所有作者均声明没有利益冲突。
Conflict of Interests:
The authors declare that they have no conflict of interests.
作者贡献声明:
李沁、邓晶负责研究设计及论文撰写。李沁、丁志颖负责统计学及方法设计。李沁、宗晴晴负责数据的收集与分析。李奥、邓晶负责文章审阅。
Author’s Contributions:
LI Qin and DENG Jing designed the research and drafted the paper. LI Qin and DING Zhiying handled statistical and methodological design. LI Qin and ZONG Qingqing collected and analyzed the data. LI Ao and DENG Jing reviewed this paper.
