Page 47 - 南京医科大学自然版
P. 47

第44卷第6期         茆晓源,陈     岩,何晓彤,等. 基于扩张残差注意力网络的颞下颌关节区多模态影像融合[J].
                  2024年6月                     南京医科大学学报(自然科学版),2024,44(6):781-787                        ·783 ·







                                                             DILRAN

                             CT
                                Preprocessing         Feature extractor
                                                                                Fusion  Recon



                                                             DILRAN
                            MRI




                           Laplacian  Brightness  Pooling  Upsample  ReLu  Convolution Element⁃wise  Element⁃wise
                                   enhancement                                     addition   product
                                                      图1   医学影像融合模型
                                                 Figure 1  Medical image fusion model














                                                                           Convolution Downsample Upsample  Sigmoid
                                     A                      B
                                                                                 图3 残差注意力网络
                   A:Fusion image without preprocessing. B:Fusion image after pre⁃
                                                                       Figure 3  Residual attention network structure
                processing.
                     图2 经预处理或未经预处理的融合图像对比
                Figure 2  Comparison of fusion images with and without  F(x)=(1+S(x))×T(x)                  (1)
                        preprocessing                                 其中,x 是来自前一层的特征图,F(·)为输出特
                                                                  征图,S(·)为软掩膜分支函数,T(·)为主干分支函数。
                                                                      在金字塔注意力网络中,为了降低网络复杂
                    本研究使用的拉普拉斯算子是:
                                                                  度,本研究使用具有较小内核滤波器 的卷积序列
                                                                                                   [9]
                    é -0  -1   -0 ù
                    ê            ú                                取代具有较大内核滤波器的卷积序列。输出特征
                    ê -1  -5   -1 ú
                    ë -0  -1   -0 û                               由公式(2)进行计算。
                1.2.2 特征提取模块                                          F(x)=(1+P1 (P2 (P3 (x))))×C(x)        (2)
                    特征提取模块的结构如图 1 所示,经过预处理                            其中,x 是输入特征图,F(·)为输出特征图,Pi
                的图像首先输入至具有1×1卷积层的残差注意力网                          (·),i{1,2,3}为特征金字塔注意力网络中相应的
                络,从而获得64维的浅层特征图。然后将浅层特征                           CBi的参数,C(·)为主干分支函数。
                                           [7]
                图传递至扩张残差注意力网络 (dilated residual at⁃                   残差注意力网络缺点是不能提取和学习深层
                tention network,DILRAN)以获得深层语义特征。                 语义特征,使用金字塔注意力网络                [10] 可以有效解决
                    DILRAN 模块的设计原理受到残差注意力机                        这个问题。金字塔注意力网络结构如图4所示。
                制 和金字塔注意力机制的启发。残差注意力网络                                金字塔注意力网络可能会丢失图像中的局部信
                 [8]
                                                                              [11]
                架构如图3所示。                                          息和精细纹理 。为解决这一问题,本研究在输入图
                                                                                            [12]
                    上方的主干和下方的软掩膜分支的组合按照                           像的浅层特征上进行扩张卷积 来提取多尺度信息,
                公式(1)建立残差注意力网络。                                   从而提高模型多尺度特征提取能力。DILRAN 模型
   42   43   44   45   46   47   48   49   50   51   52