SMARTIES: 面向遥感的频谱感知多传感器自编码器

SMARTIES: 面向遥感的频谱感知多传感器自编码器

论文解读 | ICCV 2025 | 2026-05-31


项目内容
标题SMARTIES: Spectrum-Aware Multi-Sensor Auto-Encoder for Remote Sensing Images
作者Gencer Sumbul, Chang Xu, Emanuele Dalsasso, Devis Tuia
会议ICCV 2025
arXiv2506.19585
GitHubgsumbul/SMARTIES
关键词多传感器融合, 频谱感知空间, 跨传感器Token Mixup, 传感器无关表示, 基础模型

遥感领域存在一个长期被忽视但极为关键的问题:传感器碎片化

从光学传感器(Sentinel-2、Landsat)到微波雷达(Sentinel-1 SAR),每种传感器都有其独特的:

  • 波段配置:不同数量、不同波长范围的光谱通道
  • 空间分辨率:从10米到数百米不等
  • 数据模态:光学反射率、后向散射系数、热辐射等

当前的深度学习模型(无论是任务特定的还是基础模型)通常面临以下困境:

┌─────────────────────────────────────────────────────────┐
│  现有范式:每个传感器需要独立模型                           │
│                                                         │
│  Sentinel-2 ──→ Model_A ──→ 重新训练                     │
│  Landsat    ──→ Model_B ──→ 重新训练                     │
│  Sentinel-1 ──→ Model_C ──→ 重新训练                     │
│  MODIS      ──→ Model_D ──→ 重新训练                     │
│                                                         │
│  问题:架构改动 + 重新训练 = 扩展性差                      │
└─────────────────────────────────────────────────────────┘

核心痛点:适应不同的传感器输入需要同时进行架构改动和重新训练,严重限制了模型在多传感器场景下的扩展性和泛化能力。


SMARTIES的核心思想是将异构传感器数据投影到一个统一的频谱感知空间中。

关键设计

输入:任意传感器数据(可变波段数)
频谱编码器:将每个波段映射到频谱感知嵌入
共享空间:所有传感器数据在同一空间中表示
输出:传感器无关的通用表示

技术细节

  • 每个光谱波段被编码为一个频谱感知token
  • token的嵌入向量编码了波长信息
  • 不同传感器的token可以在同一空间中交互和融合

这是SMARTIES最巧妙的设计之一。

传统Mixup vs 跨传感器Mixup

方法混合方式目的
传统Mixup同一图像的不同样本混合数据增强、正则化
跨传感器Mixup不同传感器的token混合学习跨传感器的通用表示

具体实现

训练时:
1. 从不同传感器采样token
2. 在频谱感知空间中进行混合
3. 模型需要重建被混合的原始token

效果:
- 强制模型学习传感器无关的特征
- 增强跨传感器的泛化能力
- 无需配对数据即可学习传感器间的关联

SMARTIES使用单一的统一Transformer模型处理所有传感器:

# 伪代码示意
class SMARTIES:
    def __init__(self):
        self.spectral_encoder = SpectrumAwareEncoder()
        self.transformer = UnifiedTransformer()
    
    def forward(self, sensor_data, band_info):
        # 1. 频谱感知编码
        tokens = self.spectral_encoder(sensor_data, band_info)
        
        # 2. 跨传感器Token Mixup(训练时)
        if self.training:
            tokens = cross_sensor_mixup(tokens)
        
        # 3. 统一Transformer处理
        features = self.transformer(tokens)
        
        # 4. 重建目标
        return self.decoder(features)

预训练数据

  • 多种遥感传感器数据集
  • 支持任意波段组合

下游任务

  1. 单模态任务:单一传感器的分类、分割
  2. 多模态任务:多传感器融合的分类、分割
对比维度传感器特定预训练SMARTIES
单传感器性能基线匹配或超越
跨传感器泛化需要重新训练直接适用
多传感器融合需要专门设计原生支持
新传感器适配架构改动+重训练零样本/少样本
  1. 频谱感知空间的有效性:通过将波段信息编码到token中,模型能够理解不同传感器的光谱特性

  2. 跨传感器Mixup的增益

    • 显著提升跨传感器泛化能力
    • 减少对配对数据的依赖
  3. 计算效率

    • 单一模型替代多个传感器特定模型
    • 推理时可处理任意波段组合

方法传感器适应预训练效率推理灵活性跨传感器迁移
传感器特定模型每个传感器独立低(N倍训练)低(固定输入)不支持
多头编码器共享主干中(固定头数)有限
SMARTIES统一空间高(单次训练)高(任意波段)原生支持

  1. 范式创新:从"为每个传感器训练模型"转变为"训练一个理解频谱的通用模型"
  2. 实用性强:支持任意波段组合,完美适配实际遥感数据的多样性
  3. 扩展性好:新传感器只需定义波段信息,无需修改模型架构
  4. 代码开源:提供完整的预训练模型和使用示例
  1. 空间信息处理:主要关注光谱维度,空间特征的处理相对简单
  2. 时序信息:未显式处理多时相数据
  3. 计算成本:预训练需要大量多传感器数据
  1. 时空联合建模:将频谱感知空间扩展到时序维度
  2. 更多传感器类型:扩展到SAR、高光谱、热红外等
  3. 下游任务适配:针对特定任务的微调策略


SMARTIES提出了一种优雅的解决方案来应对遥感领域的传感器碎片化问题。通过引入共享频谱感知空间跨传感器Token Mixup,它成功地将异构传感器数据统一到一个通用的表示空间中。

核心贡献

  1. 首次实现真正的传感器无关遥感基础模型
  2. 创新的跨传感器Token Mixup训练策略
  3. 支持任意波段组合的灵活推理

这项工作为遥感基础模型的发展开辟了新方向:从为每个传感器设计模型,到让模型理解频谱本身


文章生成时间:2026-05-31 17:05:26 关键词:SMARTIES, 多传感器融合, 频谱感知, 跨传感器Token Mixup, 遥感基础模型, ICCV 2025

Related Content