RS-33 Hyperspectral Foundation Model Transfer

Series - 2024-2026 遥感 AI 细分研究方向

RS-33 Hyperspectral Foundation Model Transfer

高光谱 foundation model 的迁移问题,本质上不是“有没有预训练模型”,而是“预训练域、传感器谱段、空间分辨率、标注粒度和下游小样本协议是否一致”。2024-2026 的代表性工作已经从单数据集 HSI 分类,推进到 HyperGlobal-450K、SpectralEarth/EnMAP、HyperSeg、HyperFM250K 这类大规模预训练数据。但下游仍常落回 Indian Pines、Pavia University、Houston 2013、Salinas、WHU-Hi 等小数据集,导致两个矛盾:

  1. 大模型有谱-空表示能力,但小数据全量微调很容易记住局部空间纹理和 train/test split。
  2. 大规模卫星 HSI 与经典机载 HSI 的光谱响应、空间分辨率和地物类别差异很大,简单 fine-tune 不一定是真的 transfer。

最值得做的小论文切口:建立一个 HSI-FM transfer protocol,用统一 split、统一预算和统一参数量比较 linear probe、adapter、LoRA、prompt/tuning-free、full fine-tuning,并增加 leave-dataset-out / leave-sensor-out / few-shot 曲线和过拟合诊断。

论文/项目年份/venue链接代码/数据和 RS-33 的关系
SpectralGPT: Spectral Remote Sensing Foundation ModelTPAMI 2024GitHub paper pageGitHub, Zenodo早期谱域 FM,使用 3D token 和多目标重建,适合做 full fine-tune 与 linear probe 基线。
S2MAE: A Spatial-Spectral Pretraining Foundation Model for Spectral Remote Sensing DataCVPR 2024CVF PDF代码状态需再核验3D masked transformer + 高 mask ratio,适合研究少样本 HSI 分类迁移。
HSIMAE: A Unified Masked Autoencoder with Large-scale Pretraining for Hyperspectral Image ClassificationJSTARS 2024GitHubGitHub官方结果覆盖 Salinas、Pavia University、Houston 2013、WHU-Hi-LongKou,并报告 5/10/15/20 samples per class。
HyperSIGMA: Hyperspectral Intelligence Comprehension Foundation ModelTPAMI 2025arXivGitHub, HyperGlobal-450K十亿级 HSI FM,提供 spatial/spectral MAE 权重,覆盖多任务多数据集,是主要迁移基座。
SpectralEarth: Training Hyperspectral Foundation Models at ScaleJSTARS 2025 / arXiv 2024arXivGitHub, DLR dataset基于 EnMAP 的全球多时相 HSI 预训练集,带 land-cover、crop-type、tree-species 下游数据,适合研究卫星 HSI 到任务数据迁移。
HyperFree: A Channel-adaptive and Tuning-free Foundation Model for HSICVPR 2025CVFProject, HF0.4-2.5 μm weight dictionary,强调 tuning-free 与变通道适配,是“少/免微调”强基线。
SpecAware: Spectral-content Aware FM for Multi-sensor HSI MappingISPRS JPRS 2026ScienceDirect, arXivGitHub planned用 sensor meta-attributes + image semantic features 做统一 embedding,直接对应 cross-sensor transfer。
Cross-Domain Transfer of Hyperspectral Foundation ModelsICPR 2026 / arXivarXiv未见官方代码明确比较 in-domain training、cross-modality transfer 和 cross-domain transfer;为“遥感 HSI FM 迁移到新域”提供研究框架。
SpectralEarth-FM: Bringing Hyperspectral Imagery into Multimodal EO PretrainingarXiv 2026arXiv待核验将 EnMAP/EMIT/DESIS 与 Sentinel-2、Landsat 等共址,对跨模态/跨传感器迁移很关键。
HyperFM: Efficient HSI FM with Spectral GroupingCVPR 2026 Findings / arXivarXiv待核验面向 PACE-OCI 等长谱段 HSI,突出 spectral grouping 和高效 transfer。
HyperspectralMAE: Fourier-Encoded Dual-Branch MAEarXiv 2025arXiv待核验在 Hyperion/EnMAP 预训练后迁移到 Indian Pines,适合放入“classic benchmark transfer”比较。

Indian Pines、Pavia University、Houston 2013、Salinas 等经典数据集常用于 HSI classification,但它们通常是单场景、单传感器、空间相邻样本强相关。随机抽样时,训练和测试像素可能来自同一地块或相邻区域,模型可以靠局部纹理和空间平滑拿高分。这会掩盖 foundation model 是否真的学到了可迁移谱-空表示。

更稳妥的设置应包括:

  • random pixel split:保留与旧论文对齐,但只作为可比基线。
  • spatial block split:减少空间邻近泄漏。
  • leave-dataset-out:如用 Pavia + Houston + Salinas 适配,再测 Indian Pines。
  • leave-sensor-out:如 EnMAP / Hyperion / PRISMA / DESIS 之间迁移。
  • few-shot curve:1/2/5/10/20 samples per class,而不是只报一个 shot。

SpectralEarth 这类 EnMAP 全球数据能提供大规模 HSI 表示,但其 30m 级卫星空间分辨率、202 bands、全球场景分布,与 AVIRIS/ROSIS/CASI 等经典机载数据差异很大。HyperSIGMA 的 HyperGlobal-450K 覆盖 EO-1 和 GF-5B 等全球 HSI,也仍会面对传感器响应、空间尺度、处理级别、噪声和地物体系差异。

因此,transfer 需要拆成两个层面:

  • spectral transfer:中心波长、band width、SRF、噪声和缺失 band 能否对齐。
  • semantic/spatial transfer:地物类别、空间分辨率、地块尺度和纹理是否可迁移。

很多论文比较“预训练 vs 从头训练”,但没有系统比较:

  • 冻结 backbone 的 linear probe 是否已经足够。
  • 只调 adapter/LoRA 能否接近 full fine-tuning。
  • full fine-tuning 的收益是否来自过拟合。
  • tuning-free/prompt-based 方法在不同传感器和不同 shot 下是否稳定。
  • 同样训练预算下,哪种方法更省标注、更省显存、更稳。
迁移策略做法优点风险适合数据
Linear probe冻结 HSI-FM,只训练分类头或浅层 decoder最能测表示质量,低过拟合,便宜不能修正传感器/类别差异;对小数据上限有限Indian Pines/Pavia/Houston few-shot baseline
Adapter在 backbone block 中插入小模块参数少,可适配新域adapter 位置、瓶颈维度、初始化影响大cross-dataset、cross-sensor 小样本
LoRA对 attention/MLP 权重加低秩更新参数效率高,便于多域保存rank 选择敏感,可能仍过拟合空间 split多数据集多任务微调
Prompt / tuning-free类似 HyperFree,用 prompt 或动态 embedding 直接适配训练成本低,适合变 band对类别定义和 prompt 质量敏感快速迁移、无标注/极少标注
Full fine-tuning全模型更新上限高小数据最容易过拟合,算力和存储重有足够标签、严格 spatial split
Cross-domain pre-adaptation先在目标传感器未标注数据上 SSL/TTA,再少样本监督可缓解传感器 shift训练流程复杂,可能引入伪标签偏差EnMAP/PRISMA/Hyperion 到本地任务
  • SpectralGPT:早期 TPAMI 谱域 FM,作为大模型 generative pretraining baseline。
  • S2MAE / HSIMAE:MAE 系 spectral-spatial baseline。
  • HyperSIGMA:强 HSI FM 主基线,分别测试 spatial MAE、spectral MAE 与融合特征。
  • SpectralEarth pretrained models:卫星 EnMAP 预训练基线。
  • HyperFree:tuning-free/channel-adaptive 强基线。
  • 如果可得:SpecAware、SpectralEarth-FM、HyperFM。

经典小数据:

  • Indian Pines:农业场景,小图、类别不平衡、空间相关强。
  • Pavia University / Pavia Center:城市区域,ROSIS 数据,类别较少但空间结构明显。
  • Houston 2013:城市 HSI,多类地物,常用于分类。
  • Salinas:农业场景,类别相对规整。

较大或更现实数据:

  • WHU-Hi 系列:大尺度机载 HSI,可测试空间泛化。
  • SpectralEarth downstream:EnMAP-CORINE、EnMAP-NLCD、EnMAP-CDL、EnMAP-BD Foret 等。
  • PRISMA / EnMAP / DESIS / Hyperion 公开片区:用于 leave-sensor-out。

建议每个数据集至少跑 4 组:

  1. Random pixel split:和旧工作对齐。
  2. Spatial block split:按空间块划分,防止相邻像素泄漏。
  3. Few-shot class-balanced:1/2/5/10/20 samples per class。
  4. Leave-dataset-out / leave-sensor-out:源域若干数据集训练,目标域只 linear probe 或 few-shot adapter。

分类指标:

  • OA / AA / Kappa。
  • macro-F1,避免大类主导。
  • per-class F1,重点看少样本和长尾类别。

迁移与稳健性指标:

  • transfer gain:相对从头训练的提升。
  • few-shot AUC:shot 数从 1 到 20 的曲线面积。
  • overfit gap:train vs validation/test,尤其 spatial split。
  • parameter efficiency:可训练参数比例、显存、训练时间。
  • sensor shift drop:同模型从 source sensor 到 target sensor 的性能下降。

How Should Hyperspectral Foundation Models Transfer? A Parameter-Efficient and Leakage-Aware Protocol for Cross-Dataset HSI Adaptation

在经典 HSI 小数据上,full fine-tuning 的表观优势很大一部分来自空间泄漏和过拟合;在 spatial split / leave-dataset-out 设置下,adapter 或 LoRA 可以以更少参数获得更稳定的跨数据集迁移,而 linear probe 是最可信的表示质量下界。

  1. 统一 HSI 输入适配:把不同数据集 band 信息标准化为 wavelength metadata;对缺失/不匹配 band 用 interpolation 或 learned band projection。
  2. 迁移策略套件:linear probe、adapter、LoRA、full fine-tuning、HyperFree-style tuning-free。
  3. 泄漏感知 split:实现 random、spatial block、leave-dataset-out、leave-sensor-out。
  4. 过拟合诊断:记录 train/test gap、feature CKA、类别混淆、空间错误热力图。
  5. 样本效率曲线:按 shot 数和可训练参数量画 performance-cost frontier。

第一阶段:

  • 数据:Indian Pines、Pavia University、Houston 2013、Salinas。
  • 模型:HSIMAE、SpectralGPT、HyperSIGMA。
  • 策略:linear probe、LoRA、full fine-tune。
  • 目标:验证 full fine-tune 在 random split 上更强,但在 spatial split 下 gap 缩小或不稳定。

第二阶段:

  • 加入 SpectralEarth downstream 或 WHU-Hi。
  • 加入 adapter 与 HyperFree。
  • 做 leave-dataset-out。

第三阶段:

  • 加入 EnMAP/PRISMA/DESIS/Hyperion 传感器迁移。
  • 测 missing band 和 spectral response mismatch。
风险表现规避
数据 split 泄漏random split 分数虚高强制 spatial block split,报告地理距离
代码不可复现权重或数据不可下载先选 HyperSIGMA、SpectralGPT、HSIMAE、SpectralEarth 这类开源项目
band 对齐不公平不同模型输入 band 数不一致统一记录 band subset、插值方式和 wavelength metadata
full fine-tune 过拟合小数据高 train acc、低 OODearly stopping、weight decay、冻结层对照、重复 seed
计算成本高大模型多 split 难跑先 ViT-B/小模型,LoRA rank 4/8/16,减少全参微调
旧 benchmark 结论不稳不同论文 split 不同发布 split 文件和脚本,重复 5 seeds
  1. HyperSIGMA GitHub:先确认模型权重、任务脚本和 HyperGlobal-450K 说明。
  2. SpectralEarth arXivDLR dataset page:理解大规模 EnMAP 预训练与下游任务。
  3. HyperFree CVPR 2025:作为 tuning-free / channel-adaptive 迁移路线。
  4. Cross-Domain Transfer of Hyperspectral Foundation Models:直接对应跨域迁移问题。
  5. HSIMAE GitHub:借用 5/10/15/20 samples per class 的小样本协议。
  6. SpectralGPT GitHub:作为 TPAMI 2024 谱域 FM 基线。

RS-33 不建议做“我又提出一个 HSI 分类网络”。更好的论文形态是:提出一个 迁移评测协议 + 参数高效适配方法 + 泄漏/过拟合诊断。如果方法部分要有明确创新,可以做一个 Wavelength-aware LoRA/Adapter:LoRA rank 或 adapter gate 由 band metadata、sensor id 和目标域少量统计量动态调节。这样问题足够细,又能连接 HyperSIGMA/SpectralEarth/HyperFree/SpecAware 这条 2024-2026 的主线。

Related Content

评论