Page 14 - 南京医科大学自然版
P. 14
第44卷第9期
·1186 · 南 京 医 科 大 学 学 报 2024年9月
U⁃NetH CCI
1 64 64 128646464 2
RGB to CCI
572 570 568 568 566 388 388 HSV space mechanism
× × × × × × ×
572 570 568 568 566 388 388
128 128 256 128
Input Coordinate attention
Extracting the
Residual
284 2 282 2 280 2 280 2 278 2 276 2 H×W×C color space of
image CCI
X max Y max
H×1×C
256 256 512 256 pool pool 1×W×C
Concat+Conv2d 1×(W+H)×C/r
Calculation of
140 2 138 2 136 2 136 2 134 2 132 2 BN+Non⁃linear 1×(W+H)×C/r standard deviation
of human
plasma saturation
H×1×C Conv2d Conv2d H×W×C
512 512 1 024 512
Maxpooling Split
Up Conv 2×2 H×1×C ReLU ReLU H×W×C
Feature Copy Output of
Feature Crop 68 2 66 2 64 2 64 2 62 2 60 2 discrimination
Re⁃
Conv 1×1 weight H×W×C results
Conv 3×3+CA,ReLU+BN 32 2 30 2 1 024 28 2
Padding
Feature center Output
图10 主干网络结构
Figure 10 Backbone network structure diagram
表1 各模型标准方差实验10次的平均对比结果
Table 1 The average comparison results of standard deviation experiments for each model conducted ten times
Training set Testing set
Model
Acc(%) Pre(%) Re(%) T(ms) Acc(%) Pre(%) Re(%) T(ms)
UCSALL 99.19 099.48 99.22 1 598.36 94.69 096.12 95.38 1 627.33
UCSH 98.71 099.22 98.71 807.13 93.24 096.77 92.31 798.42
UCSS 99.52 100.00 99.23 586.38 99.03 100.00 98.46 617.02
UCSV 93.06 095.99 92.76 693.29 87.44 090.63 89.23 739.11
差值进一步拉开。在4种模型中UCSS模型泛化能力 直在发生变化,对网络层激活函数后进行 norm,使
相对稳定,训练集与测试集Acc仅降低0.49%。其余 得每层的输入数据分布一致(即均值为 0,方差为
3种模型训练集与测试集Acc分别降低4.5%、5.47% 1),零均值的输入,可以避免梯度同号,从而出现
和5.62%,其他模型泛化能力相对UCSS较弱。 “之”字形优化的情况。消融实验结果见表2。
2.2 消融实验结果 Model_1 至 Model_7 对比验证了 CA、BN 与 Pad⁃
首先,验证在没有 CA 模块的情况下,BN 和 ding模块对语义学习CCI法的深层次特征提取和判
Padding卷积对血浆语义分割的性能影响,在卷积过 别结果影响。由表 2 可知,引入单个模块至基础
程中卷积核的尺寸远远小于特征矩阵,感受野受限 U⁃Net 网络中会造成分割精度下降现象;将模块以
导致无法锁定式提取全域信息,以往研究大多以扩 组合形式引入基础 U⁃Net 网络会提升分割精度;根
大感受野的方式来缓解这一缺陷,但仍无法提取全 据消融实验,Model_4 方法的组合模块对基础网络
部特征,利用 CA 模块的优势扩大卷积视野。随后 的Acc提升了6.28%;将3种轻量化模块同时引入至
验证BN模块,当语义网络的底层发生微弱变化时, 基础 U⁃Net 网络中,Acc、Pre、Re 分别提高了 7.73%、
这些变化会随着层数的增加被放大,意味着对于高 5.56%、6.92%,T 缩短了 902.24 ms。消融实验结果
层网络要不断进行参数更新以适应底层参数的变 表明,本研究方法不仅在特征深层次强化方面表现
化。最后 Padding 模块,即每层的输入数据分布一 出色,而且还实现了快速高效计算。