该文档属于类型a(单个原创研究报告)。以下是针对《IEEE Transactions on Geoscience and Remote Sensing》发表的HAM模型的完整学术报告:
本研究由Mingyue Li(中南民族大学电子信息工程学院)、Chengyi Xiong(IEEE会员,中南民族大学)、Zhirong Gao(中南民族大学计算机学院)及Jiayi Ma(IEEE高级会员,武汉大学电子信息学院)共同完成,发表于2025年《IEEE Transactions on Geoscience and Remote Sensing》第63卷,文章编号5641314。研究得到中央高校基本科研项目(CZ25010)及多光谱信息处理技术国家重点实验室项目(6142113210303)的支持。
科学领域:本研究属于遥感图像超分辨率(RSISR)领域,聚焦于通过深度学习提升低分辨率遥感图像的重建质量。
研究动因:现有基于Mamba的RSISR模型存在两大局限:
1. 层次特征交互不足:传统单向传播策略导致多尺度空间结构(如纹理与语义)融合低效;
2. 局部-全局关联建模不足:固定扫描轨迹限制了非因果局部结构与宏观上下文的同步建模。
研究目标:提出分层注意力Mamba网络(HAM),通过空间-频率特征融合与动态层次聚合,实现高效的多尺度特征捕获与高清重建。
HAM基于残差嵌套(RIR)框架,包含三个核心模块:
- 浅层特征提取(SFE):通过3×3卷积从输入低分辨率图像提取初始特征。
- 空间-频率Mamba组(SFMG):由6个SFMG模块堆叠而成,每个SFMG包含6个空间-频率Mamba块(SFMB)。SFMB通过以下子模块实现特征增强:
- 视觉状态空间模型(VSSM):采用双向四向扫描策略(SS2D模块)建模长程依赖。
- 空间-频率信息交互模块(SFIIM):
- 动态频谱增强(DFSE):傅里叶变换解耦振幅(全局结构)与相位(局部纹理),分别通过通道注意力(CA)增强;
- 混合空间特征聚合器(HSFA):双分支门控机制(3×3卷积与线性层并行)融合局部特征。
- 分层聚合注意力(HAA):通过差异矩阵(D = max(S) - S)计算跨层特征权重,抑制冗余并增强互补性。
科学价值:
1. 理论创新:提出首个结合Mamba与空间-频率双域学习的RSISR框架,通过振幅-相位解耦与动态层次聚合解决了长程依赖与多尺度融合的难题;
2.应用价值:HAM在保持低计算开销的同时,显著提升复杂场景(如农田条纹、跑道标线)的纹理重建精度,适用于高精度地物观测。
该研究为遥感图像超分辨率提供了高效的新范式,其双域融合策略与动态层次注意力机制对后续视觉修复任务具有广泛启发。