关于高分辨率遥感影像识别的DCNN特征选择性和不变性表达
摘要:

认知科学研究表明,人类视觉对图像的识别具有很强的不变性。DCNN 能够从原始的图像中进行多层特征编码,接近于人类的视觉水平。由于DCNN在特征表达上的优越性能,它在高分辨率遥感影像场景识别与高光谱遥感影像分类的研究中取得了显著效果。然而,目前遥感研究领域对于DCNN为何能够有效表达特征以准确识别不同地物,还缺少深入的调查。为此,本文在大规模遥感影像标注库上训练深度神经网络AlexNet,在其各个卷积层的神经元层面,以 “视觉刺激—特征响应,特征编码—分类解码”的思路框架分析DCNN在影像识别中一般规律。通过直方图统计、Representational Dissimilarity Matrix (RDM)、Class Activation Mapping (CAM)等计算与可视化方法,揭示出DCNN对于高分辨率遥感影像识别具有明显的选择性与不变性表达能力。这为DCNN在遥感研究领域开展相关研究奠定了一定的认知基础,能够在模型设计与迁移学习方面为遥感影像的分析与理解研究提供重要参考依据。
关键词:
影像识别,DCNN,特征表达,选择性,不变性
贡献:
a)首次基于大规模影像(35类地物共24,000余幅)的视觉特征刺激,使用统计与可视化的方法探讨DCNN各卷积层的特征表达。发现神经元对遥感影像的视觉特征刺激具有稀疏性激活状态,并表现出类内一致性和类间差异性,且在高层表现得更加明显,说明特征的选择性表达在遥感影像的识别中发挥重要作用。
b)通过观察DCNN所有神经元对遥感影像的视觉特征刺激的激活状态,发现DCNN在影像识别任务中,能够表现出类似于人脑对姿态、大小、形状、颜色等差异性视觉特征刺激的不变性表达,说明DCNN对遥感影像的多样性地物特征具备不变性表达性能。
c)通过可视化分析DCNN对相同影像的特征编码结果与类别响应定位,发现DCNN的选择性与不变性特征编码在识别任务中能成功解码到地物的本征特征;引入RDM以几何表达方式观察神经元的相似性响应情况,对于理解遥感影像识别的DCNN模型具有直观意义。