You are on page 1of 11

(19)中华人民共和国国家知识产权局

(12)发明专利申请
(10)申请公布号 CN 112926457 A
(43)申请公布日 2021.06.08
(21)申请号 202110220080 .1 G06N 3/08 (2006 .01)
(22)申请日 2021 .02 .26

(71)申请人 中国电子科技集团公司第二十八研
究所
地址 210007 江苏省南京市秦淮区苜蓿园
东街1号

(72)发明人 李雪松 李晓冬 杜记川 罗子娟


吴蔚 杨东

(74)专利代理机构 江苏圣典律师事务所 32237


代理人 胡建华

(51)Int .Cl .
G06K 9/00 (2006 .01)
G06K 9/46 (2006 .01)
G06K 9/62 (2006 .01)
G06N 3/04 (2006 .01)
权利要求书2页 说明书6页 附图2页

(54)发明名称
一种基于融合频域和空间域网络模型的SAR
图像识别方法
(57)摘要
本发明属于图像识别技术领域, 公开了一种
基于融合频域和空间域网络模型的SAR图像识别
方法, 包括步骤: 将原始空间域图像转换为频域
图像 ;频域图像进行信道选择获取有效频域信
号; 将有效频域信号输入到频域主干网络提取频
域特征; 将原始空间域图像输入到空间域主干网
络, 提取出空间域特征; 通过网络模型融合空间
域特征和频域特征; 对融合后的特征输入到分类
器中, 实现SAR图像中目标的识别分类。本发明设
计了一种端到端的融合频域和空间域的网络模
型, 不仅考虑SAR图像的空间域的像素特征, 还针
对SAR区别于可见光的成像特性, 提取出SAR图像
CN 112926457 A

的频域特征, 通过融合空间域特征和频域特征,
能够进一步提升SAR图像识别模型的有效性和鲁
棒性。
CN 112926457 A 权 利 要 求 书 1/2 页

1 .一种基于融合频域和空间域网络模型的SAR图像识别方法, 其特征在于, 包括如下步


骤:
步骤1, 获取待识别的SAR图像, 对获取的SAR图像进行图像数据增强, 增强后的图像作
为空间域图像;
步骤2, 将步骤1中的空间域图像的大小变换为N*N, 对该变换后的空间域图像以n*n的
尺寸块进行划分, 得到N/n*N/n个尺寸块; 通过频域转换方法将每个尺寸块空间域的图像信
号变换成以频率成分表示的结构形式, 每个尺寸块中有n*n个不同的频率分量; 不同尺寸块
中相对应位置的频率分量作为构造的频域图像的一个通道, 所有的n*n个通道通过维度变
换构成新的频域图像F1 ;
步骤3, 将步骤1中的空间域图像输入到空间域主干网络提取空间域特征向量Fspace ;
步骤4, 对步骤2中获得的频域图像F1进行通道选择, 获得有效频域信号F2 ;
步 骤 5 ,将步 骤 4获 得的 有效 频 域 信号 F 2 输 入 到 频 域 主 干网 络 提 取 频 域 特 征向 量
Ffrequency ;
步骤6, 将步骤3中获得的空间域特征向量Fspace和步骤5中获得的频域特征向量Ffrequency
进行特征融合, 得到融合后的目标特征向量Ffusion ;
步骤7, 将步骤6获得的融合特征向量Ffusion输入到后续网络中, 进行特征降维和类别概
率预测, 实现目标的识别分类。
2 .根据权利要求1所述的一种基于融合频域和空间域网络模型的SAR图像识别方法, 其
特征在于, 所述步骤1中对SAR图像进行图像数据增强包括: 在训练阶段, 数据增强的方式包
括图像标准化、 图像尺度变换、 几何变换以及随机裁剪方式; 在测试阶段, 采用图像尺度变
换和图像标准化的方式, 将增强后的图像作为空间域图像。
3 .根据权利要求1所述的一种基于融合频域和空间域网络模型的SAR图像识别方法, 其
特征在于, 所述步骤2包括:
步骤2 .1, 将空间域图像的大小变换为N*N, 即变换后的空间域图像长度和宽度均为N,
以n*n的尺寸块进行划分, 得到N/n*N/n个尺寸块;
步骤2 .2, 采用二维离散余弦变换的方式将每个尺寸块空间域的图像信号变换为以频
率成分表示的结构形式, 二维离散余弦变换的计算公式为:
N N T
Y=C ·X·(C )
其中, X是每个尺寸块空间域的图像信号, Y是输出的每个尺寸块的频域信号, C是变换
系数矩阵, 表示公式如下所示:

其中,j, k∈{0, 1, 2,…,N‑1}, j和k分别表示在空间域图像信号中像素点横轴和纵轴的


位置;当j=0时, αj=1; 当j>0时, αj=2;
步骤2 .3,对于不同尺寸块得到的频域信号Y, 抽取相对应位置的频率分量进行连接,作
2
为构造的频域图像的一个通道; 由于频域信号Y中一共有n 个位置, 所以构造的频域图像为
2 2
二维特征向量, 大小为n *(N/n) , 所述相对应位置指每个尺寸块得到的频域信号Y中第i个
2
位置,i∈{1, 2,
…, n }; 将上述的二维频域图像通过维度展开构成新的三维频域图像F1 , 图

2
CN 112926457 A 权 利 要 求 书 2/2 页

像大小为n2*(N/n)*(N/n), 其中n2为频域图像的通道个数。
4 .根据权利要求1所述的一种基于融合频域和空间域网络模型的SAR图像识别方法, 其
特征在于, 所述步骤3中, 将空间域图像输入到基于ResNet 50的空间域主干网络, 获得空间
域特征向量Fspace。
5 .根据权利要求1所述的一种基于融合频域和空间域网络模型的SAR图像识别方法, 其
特征在于, 所述步骤4包括:
步骤4 .1,输入频域图像F1到注意力网络获得注意力特征向量Mask, 表达公式如下所示:
Mask=Sigmoid(BN(Conv(ReLU(Conv(F1)))))
其中, Conv表示1×1卷积操作, BN表示批归一化, Sigmoid、
ReLU表示激活函数;
步骤4 .2,融合注意力特征向量Mask和频域图像F1 , 并利用卷积网络模型进行有效频率
选择得到有效频率信号F2 , 表示公式如下所示:

其中, 表示逐元素相乘。
6 .根据权利要求1所述的一种基于融合频域和空间域网络模型的SAR图像识别方法, 其
特征在于, 所述步骤5中, 所述频域主干网络为改进的ResNet 50的频域主干网络, 所述改进
是将ResNet 50残差网络的第一个卷积层和池化层移除, 保证网络模型的输入与频域信号
的输入适配。
7 .根据权利要求1所述的一种基于融合频域和空间域网络模型的SAR图像识别方法, 其
特征在于, 所述步骤6中, 通过连接的方式Concat在通道维度对空间域特征向量Fspace和频域
特征向量Ffrequency进行融合得到特征向量Ffusion , 表达公式如下所示:
Ffusion=Concat(Fspace ,Ffrequency ,dim=1)。
8 .根据权利要求1所述的一种基于融合频域和空间域网络模型的SAR图像识别方法, 其
特征在于, 所述步骤7中, 所述后续网络是一个分类器, 由全连接层网络和Softmax激活函数
组成, 将融合后的特征向量Ffusion输入到全连接层网络, 进行特征降维获取识别目标的特征
向量, 将识别目标的特征向量输入到Softmax激活函数用来预测对应于每个类别的概率, 取
概率值最大的类别作为预测的类别; 在所述后续网络模型训练阶段, 输入目标预测的类别
和标注的类别信息, 采用交叉熵损失函数对所述后续网络模型进行有监督训练。

3
CN 112926457 A 说 明 书 1/6 页

一种基于融合频域和空间域网络模型的SAR图像识别方法

技术领域
[0001] 本发明属于计算机图像识别技术领域,
具体涉及了一种基于融合频域和空间域网
络模型的SAR图像识别方法。

背景技术
[0002] 合成孔径雷达(Synthetic Aperture Radar,SAR)图像识别利用目标的特征信息
将特定目标区分出来, 实现SAR影像的解译和分析。
[0003] SAR图像目标识别被广泛应用在军事领域、 资源勘探和环境监测等方面。相较于可
见光图像和红外图像, SAR图像具有全天候、穿透性强以及图像信息更加丰富等特点。一方
面, 由于SAR图像是通过目标的微波反射来成像; 另一方面, SAR图像一般包含大量的噪声干
扰和几何形变。 因此,SAR图像的目标识别非常具有挑战性。
[0004] SAR图像识别吸引了一大批的国内外学者进行研究。 传统的SAR图像识别的框架包
含以下几个步骤:(1)图像预处理模块: SAR图像通常会存在相干斑噪声, 这些噪声干扰会影
响图像识别的性能, 图像预处理模块的功能是对这些噪声进行抑制;(2)特征提取模块: 特
征的提取和选择对目标识别的性能起到关键性影响, SAR目标特征主要包括几何特征、 散射
特征和变换特征;(3)分类识别模块: 将提取的特征通过分类器映射到特征空间实现目标分
类识别。 随着深度学习方法在计算机视觉领域的深入研究和广泛应用, 许多深度神经网络
模型被迁移应用到SAR图像识别中, 取得了比传统方法更好的效果。这主要是因为传统方法
依赖于人工设计的特征提取器, 需要有专业的知识背景和复杂的调参过程, 并且每个方法
仅针对具体应用和固定场景, 模型的泛化性能和鲁棒性较差。而深度学习是通过构建深层
的神经网络结构以数据驱动的方式进行特征提取, 根据大量样本的学习能够得到深层的、
跟任务密切相关的特征表示, 其对数据集的表达更高效和准确, 所提取的抽象特征泛化能
力更好, 并且通过端到端的方式模型鲁棒性更强。
[0005] 虽然一些可见光图像识别的深度学习方法在SAR图像识别领域同样取得了不错的
性能, 但是SAR图像与可见光图像存在一些差异: 一方面, SAR图像每个像素的复数数据可通
过频域变换提取相应的振幅和相位信息。振幅信息与可见光图像的灰度信息有很大的相关
性, 它是地面目标对雷达波的后向散射强度; 相位信息是传感器与地面目标的往返传播距
离。另一方面, 可见光图像识别模型通常仅考虑空间域的像素点以及像素点之间关系的高
阶特征建模, 而未考虑SAR图像以及待识别目标的特性,例如背景强散射杂波的不均匀性
等。 因此, 仅考虑空间域的特征提取和模型构建, 不太适用于SAR图像识别。
[0006] 在实现本发明过程中, 发明人发现现有技术中至少存在如下问题: SAR图像由于其
成像的特性, 不仅可以获得空域的幅度图像, 还包含频域的后向散射特性。大多数现有的深
度学习方法仅搭建网络模型建模SAR目标的空域特性, 未挖掘出SAR图像的频域特性, 造成
了关键信息的损失。一些深度学习方法虽然也挖掘了SAR图像的频域特性, 但是未验证频域
信号的有效性。一方面, 由于空间域图像中存在背景信息, 背景信息转换的频域信号和前景
信息转换的频域信号分布在不同频域通道, 即存在一部分频域通道的信号为噪声信息, 不

4
CN 112926457 A 说 明 书 2/6 页

利于SAR图像的识别;另一方面,SAR图像存在有相干斑噪声,
也分布于不同的频域通道,

干扰SAR图像的识别性能。因此,
如何分离出有效频域信号至关重要。

发明内容
[0007] 发明目的: 本发明所要解决的技术问题是针对现有技术的不足, 提供一种基于融
合频域和空间域网络模型的SAR图像识别方法, 通过端到端的方式提取SAR图像的空域像素
信息和频域特征, 并进行特征融合获得目标的本质特征, 进一步的提升SAR图像识别的准确
性和鲁棒性, 同时增强模型的可解释性。
[0008] 为了解决上述技术问题, 本发明公开了一种基于融合频域和空间域网络模型的
SAR图像识别方法, 包括如下步骤:
[0009] 步骤1, 获取待识别的SAR图像, 对获取的SAR图像进行图像数据增强, 增强后的图
像作为空间域图像;
[0010] 步骤2, 将步骤1中的空间域图像的大小变换为N*N, 对该变换后的空间域图像以n*
n的尺寸块进行划分, 得到N/n*N/n个尺寸块。通过频域转换方法将每个尺寸块空间域的图
像信号变换成以频率成分表示的结构形式, 每个尺寸块中有n*n个不同的频率分量; 不同尺
寸块中相对应位置的频率分量作为构造的频域图像的一个通道, 所有的n*n个通道通过维
度变换构成了新的频域图像F1 ;
[0011] 步骤3 , 将步骤1中的空间域图像输入到空间域主干网络提取空间域特征向量
Fspace。
[0012] 步骤4, 不同频率通道对模型性能的影响不同, 有些频率通道对模型识别起到关键
作用, 有些则没有帮助, 反而会增加模型训练和推断的时间。 因此,
通过对步骤2中获得的频
域图像F1进行通道选择, 获得有效频域信号F2。
[0013] 步骤5, 将步骤4获得的有效频域信号F 2 输入到频域主干网络提取频域特征向量
Ffrequency。
[0014] 步骤6, 将步骤3中获得的空间域特征向量F space 和步骤5中获得的频域特征向量
Ffrequency进行特征融合, 得到融合后的目标特征向量Ffusion。
[0015] 步骤7, 将步骤6获得的融合特征向量Ffusion输入到后续网络中, 进行特征降维和类
别概率预测, 实现目标的识别分类。
[0016] 在一种实现方式中, 所述步骤1中对SAR图像进行图像数据增强包括: 在训练阶段,
数据增强的方式包括图像标准化、 图像尺度变换、 几何变换(平移、翻转等)以及随机裁剪等
方式; 在测试阶段, 仅采用图像尺度变换和图像标准化的方式, 将增强后的图像作为空间域
图像;
[0017] 在一种实现方式中, 所述步骤2包括:
[0018] 步骤2 .1, 将空间域图像的大小变换为N*N, 即变换后的空间域图像长度和宽度均
为N, 以n*n的尺寸块进行划分, 得到N/n*N/n个尺寸块;将空间域图像的大小变换为N*N是为
了保证数据集中所有图像得到的频域信号的一致性, 以n*n的尺寸块进行划分, 得到N/n*N/
n个尺寸块是为了分离不同频率的频域信号;
[0019] 步骤2 .2, 采用二维离散余弦变换的方式将每个尺寸块空间域的图像信号变换为
以频率成分表示的结构形式, 二维离散余弦变换的计算公式为:

5
CN 112926457 A 说 明 书 3/6 页

[0020] Y=CN·X·(CN) T
[0021] 其中, X是每个尺寸块空间域的图像信号,
Y是输出的每个尺寸块的频域信号,
C是
变换系数矩阵, 表示公式如下所示:

[0022]

[0023] 其中, j,
k∈{0, 1, 2,… ,N‑1},j和k分别表示在空间域图像信号中像素点横轴和纵
轴的位置。 当j=0时, αj=1; 当j>0时, αj=2;
[0024] 采用二维离散余弦变换的方式将每个尺寸块空间域的图像信号变换为以频率成
分表示的结构形式, 具有更好的频域能量聚焦度, 可以滤除不重要的频域区域;
[0025] 步骤2 .3, 对于不同尺寸块得到的频域信号Y, 抽取相对应位置的频率分量进行连
接, 作为构造的频域图像的一个通道; 由于频域信号Y中一共有n2个位置, 所以构造的频域
2 2
图像为二维特征向量, 大小为n *(N/n) , 所述相对应位置指每个尺寸块得到的频域信号Y中
2
第i个位置, i∈{1, 2,…,n }; 将上述的二维频域图像通过维度展开构成了新的三维频域图
2
像F1 ,图像大小为n *(N/n)*(N/n) , 其中n2为频域图像的通道个数。本步骤有利于恢复频域
信号的空间信息, 用于后续频域特征的提取, 以及频域特征与空域特征的融合。
[0026] 在一种实现方式中, 所述步骤3中, 将空间域图像输入到基于ResNet 50的空间域
主干网络, 用以提取空间域特征向量Fspace。本步骤通过挖掘像素值以及像素之间的关系, 建
模SAR图像的空域特性。
[0027] 在一种实现方式中, 所述步骤4输入频域图像, 采用基于注意力机制的信道选择方
法, 获得有效频域信号。包括:
[0028] 步骤4 .1,输入频域图像F1到注意力网络获得注意力特征向量Mask, 表达公式如下
所示:
[0029] Mask=Sigmoid(BN(Conv(ReLU(Conv(F )))))
1
[0030] 其中, Conv表示1×1卷积操作, BN表示批归一化, Sigmoid、
ReLU表示激活函数;
[0031] 步骤4 .2,融合注意力特征向量Mask和频域图像F1 ,并利用卷积网络模型进行有效
频率选择得到有效频率信号F2 , 表示公式如下所示:
[0032]
[0033] 其中, 表示逐元素相乘。
[0034] 不同频率通道对模型性能的影响不同, 有些频率通道对模型识别起到关键作用,
有些则没有帮助, 反而会增加模型训练和推断的时间, 步骤4 .1利用注意力机制建模了不同
频率通道的特征之间的重要性, 关注了模型通道层面的依赖关系; 步骤4 .2利用卷积神经网
络进一步的建模通道特征的重要性, 滤除掉重要性低的频率通道, 获得有效频域特征。
[0035] 在一种实现方式中, 所述步骤5中, 所述频域主干网络为改进的ResNet 50的频域
主干网络, 所述改进是将ResNet 50残差网络的第一个卷积层和池化层移除, 保证网络模型
的输入与频域信号的输入适配。本步骤通过对ResNet 50网络微调, 实现频域信号的深度学
习, 自动挖掘频率分布和散射特性, 提取SAR图像的频域特征。其中, 保持空间域主干网络和
频域主干网络采用相同模型结构, 还有利于后续空域特征和频域特征在相同维度空间进行
特征融合。

6
CN 112926457 A 说 明 书 4/6 页

[0036] 在一种实现方式中, 所述步骤6中, 通过连接的方式Concat在通道维度对空间域特


征向量Fspace和频域特征向量Ffrequency进行融合得到特征向量Ffusion , 表达公式如下所示:
[0037] F
fusion=Concat(Fspace ,
Ffrequency ,dim=1)
[0038] 通过通道维度的特征融合, 实现频域特征和空域特征的互补, 增强特征的判别性
和鲁棒性。
[0039] 在一种实现方式中, 所述步骤7中, 所述后续网络是一个分类器, 由全连接层网络
和Softmax激活函数组成, 将融合后的特征向量Ffusion输入到全连接层网络, 进行特征降维
获取识别目标的特征向量, 所述识别目标的特征向量的维度为所有目标的类别个数; 将识
别目标的特征向量输入到Softmax激活函数用来预测对应于每个类别的概率, 取概率值最
大的类别作为预测的类别, 从而实现目标类别的预测; 在所述后续网络模型训练阶段, 输入
目标预测的类别和标注的类别信息, 采用交叉熵损失函数对所述后续网络模型进行有监督
训练。
[0040] 有益效果: 本发明公开了一种基于融合频域和空间域网络模型的SAR图像识别方
法, 通过设计一种端到端的网络模型融合了空域的像素信息和频域的散射特性, 进行不同
域特征的互补, 挖掘出更深层次的关键特征信息。 同时,利用基于注意力的频域信道选择方
法进行有效频域信号的选择, 减少了噪声频域信号的干扰, 进一步地提升SAR图像识别的效
果和性能。

附图说明
[0041] 下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述介
绍和其他方面的优点将会变得更加清楚。
[0042] 图1为本发明实现步骤流程图;
[0043] 图2为本发明一种实施例的网络示意图;
[0044] 图3为本发明一种实施例的基于注意力机制的信道选择方法示意图;
[0045] 图4为本发明一种实施例的空间域主干网络和频域主干网络的结构示意图;

具体实施方式
[0046] 下面结合附图和具体实施例, 进一步阐明本发明。
[0047] 图1为本发明实现步骤流程图, 包括如下步骤:
[0048] 步骤1,获取待识别的SAR图像, 对获取的SAR图像进行图像数据增强,增强后的图
像作为空间域图像;
[0049] 步骤2,将步骤1中的空间域图像的大小变换为448*448,对该图像以8*8的尺寸块
进行划分, 得到56*56个尺寸块。通过频域转换方法将每个尺寸块空间域的图像信号变换成
以频率成分表示的结构形式, 每个尺寸块中有64个不同的频率分量; 不同尺寸块中相对应
位置的频率分量作为构造的频域图像的一个通道, 所有的64个通道通过维度变换构成了新
的频域图像F1 ;
[0050] 步骤3 ,将步骤1中的空间域图像输入到空间域主干网络提取空间域特征向量
Fspace。
[0051] 步骤4,通过对步骤2中获得的频域图像F1进行通道选择, 获得有效频域信号F2。

7
CN 112926457 A 说 明 书 5/6 页

[0052] 步骤5, 将步骤4获得的有效频域信号F 2 输入到频域主干网络提取频域特征向量


Ffrequency。
[0053] 步骤6, 将步骤3中获得的空间域特征向量F space 和步骤5中获得的频域特征向量
Ffrequency进行特征融合, 得到融合后的目标特征向量Ffusion。
[0054] 步骤7, 将步骤6获得的融合特征向量Ffusion输入到后续网络中, 进行特征降维和类
别概率预测, 实现目标的识别分类。
[0055] 本实施例中, 所述步骤1中对SAR图像进行图像数据增强包括: 在训练阶段,采用图
像标准化、 图像尺度变换以及随机裁剪的数据增强方式; 在测试阶段, 仅采用图像尺度变换
和图像标准化的方式, 将增强后的图像作为空间域图像;
[0056] 图2为本发明一种实施例的网络示意图, 所述步骤2包括:
[0057] 步骤2 .1, 将空间域图像的大小变换为448*448, 即变换后的空间域图像长度和宽
度均为448像素, 以8*8的尺寸块进行划分, 得到56*56个尺寸块;
[0058] 步骤2 .2, 采用二维离散余弦变换的方式将每个尺寸块空间域的图像信号变换为
以频率成分表示的结构形式, 二维离散余弦变换的计算公式为:
N N T
[0059] Y=C ·X·(C )
[0060] 其中, X是每个尺寸块空间域的图像信号, N是变换后的空间域图像长度和宽度, 值
为448。Y是输出的每个尺寸块的频域信号, C是变换系数矩阵, 表示公式如下所示:

[0061]

[0062] 其中, j,k∈{0,1,2,…,447},j和k分别表示在空间域图像信号中像素点横轴和纵


轴的位置。 当j=0时, αj=1; 当j>0时, αj=2;
[0063] 步骤2 .3, 对于不同尺寸块得到的频域信号Y, 抽取相对应位置的频率分量进行连
接, 作为构造的频域图像的一个通道; 由于频域信号Y中一共有64个位置, 所以构造的频域
图像为二维特征向量, 大小为64*3136, 所述相对应位置指每个尺寸块得到的频域信号Y中
第i个位置, i∈{1,2,…,64};将上述的二维频域图像通过维度展开构成了新的三维频域图
像F1 ,图像大小为64*56*56, 其中64为频域图像的通道个数。
[0064] 图4为本发明一种实施例的空间域主干网络和频域主干网络的结构示意图 , 所述
步骤3中, 将空间域图像输入到基于ResNet 50的空间域主干网络,用以提取空间域特征向
量Fspace ,
特征向量的维度为2048。
[0065] 图3为本发明一种实施例的基于注意力机制的信道选择方法示意图, 所述步骤4输
入频域图像, 采用基于注意力机制的信道选择方法, 获得有效频域信号。包括:
[0066] 步骤4 .1, 输入频域图像F1到注意力网络获得注意力特征向量Mask, 表达公式如下
所示:
[0067] Mask=Sigmoid(BN(Conv(ReLU(Conv(F )))))
1
[0068] 其中, Conv表示1×1卷积操作, BN表示批归一化, Sigmoid、
ReLU表示激活函数;
[0069] 步骤4 .2, 融合注意力特征向量Mask和频域图像F1 ,并利用网络模型进行有效频率
选择得到有效频率信号F2 , 表示公式如下所示:
[0070]

8
CN 112926457 A 说 明 书 6/6 页

[0071] 其中, 表示逐元素相乘。


[0072] 图4为本发明一种实施例的空间域主干网络和频域主干网络的结构示意图 , 所述
步骤5中, 所述频域主干网络为改进的ResNet 50的频域主干网络, 所述改进是将ResNet50
残差网络的第一个卷积层和池化层移除, 保证网络模型的输入与频域信号的输入适配。将
频域图像输入到改进的ResNet 50的频域主干网络,用以提取频域特征向量Ffrequency , 特征
向量维度为2048。
[0073] 本实施例中, 所述步骤6中, 通过连接的方式Concat在通道维度对空间域特征向量
Fspace 和频域特征向量Ffrequency进行融合得到特征向量Ffusion , 融合后特征向量维度为4096,
表达公式如下所示:
[0074] F
fusion=Concat(Fspace ,Ffrequency ,dim=1)
[0075] 本实施 例中 , 所述步骤7中 ,所述后续网络是一个分类器 ,由 全连接层网络 和
Softmax激活函数组成, 将融合后的特征向量Ffusion输入到全连接层网络, 进行特征降维获
取识别目标的特征向量, 全连接层网络输入的特征向量维度为4096, 输出特征向量维度为
所有目标的类别个数。将识别目标的特征向量输入到Softmax激活函数用来预测对应于每
个类别的概率, 取概率值最大的类别作为预测的类别, 从而实现目标类别的预测。在所述后
续网络训练阶段时, 输入目标预测的类别和标注的类别信息, 采用交叉熵损失函数对所述
后续网络模型进行有监督训练。
[0076] 本发明提供了一种基于融合频域和空间域网络模型的SAR图像识别方法, 具体实
现该技术方案的方法和途径很多, 以上所述仅是本发明的优选实施方式, 应当指出,对于本
技术领域的普通技术人员来说, 在不脱离本发明原理的前提下, 还可以做出若干改进和润
饰, 这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用
现有技术加以实现。

9
CN 112926457 A 说 明 书 附 图 1/2 页

图1

图2

10
CN 112926457 A 说 明 书 附 图 2/2 页

图3

图4

11

You might also like