RS-33 Hyperspectral Foundation Model Transfer

WangTong included in category and series 2024-2026 遥感 AI 细分研究方向

2026-06-07 09:32:00 2026-06-07 09:32:00 820 words 4 minutes

Series - 2024-2026 遥感 AI 细分研究方向

RS-33 Hyperspectral Foundation Model Transfer

1. 核心判断

高光谱 foundation model 的迁移问题，本质上不是“有没有预训练模型”，而是“预训练域、传感器谱段、空间分辨率、标注粒度和下游小样本协议是否一致”。2024-2026 的代表性工作已经从单数据集 HSI 分类，推进到 HyperGlobal-450K、SpectralEarth/EnMAP、HyperSeg、HyperFM250K 这类大规模预训练数据。但下游仍常落回 Indian Pines、Pavia University、Houston 2013、Salinas、WHU-Hi 等小数据集，导致两个矛盾：

大模型有谱-空表示能力，但小数据全量微调很容易记住局部空间纹理和 train/test split。
大规模卫星 HSI 与经典机载 HSI 的光谱响应、空间分辨率和地物类别差异很大，简单 fine-tune 不一定是真的 transfer。

最值得做的小论文切口：建立一个 HSI-FM transfer protocol，用统一 split、统一预算和统一参数量比较 linear probe、adapter、LoRA、prompt/tuning-free、full fine-tuning，并增加 leave-dataset-out / leave-sensor-out / few-shot 曲线和过拟合诊断。

2. 代表论文与资源

论文/项目	年份/venue	链接	代码/数据	和 RS-33 的关系
SpectralGPT: Spectral Remote Sensing Foundation Model	TPAMI 2024	GitHub paper page	GitHub, Zenodo	早期谱域 FM，使用 3D token 和多目标重建，适合做 full fine-tune 与 linear probe 基线。
S2MAE: A Spatial-Spectral Pretraining Foundation Model for Spectral Remote Sensing Data	CVPR 2024	CVF PDF	代码状态需再核验	3D masked transformer + 高 mask ratio，适合研究少样本 HSI 分类迁移。
HSIMAE: A Unified Masked Autoencoder with Large-scale Pretraining for Hyperspectral Image Classification	JSTARS 2024	GitHub	GitHub	官方结果覆盖 Salinas、Pavia University、Houston 2013、WHU-Hi-LongKou，并报告 5/10/15/20 samples per class。
HyperSIGMA: Hyperspectral Intelligence Comprehension Foundation Model	TPAMI 2025	arXiv	GitHub, HyperGlobal-450K	十亿级 HSI FM，提供 spatial/spectral MAE 权重，覆盖多任务多数据集，是主要迁移基座。
SpectralEarth: Training Hyperspectral Foundation Models at Scale	JSTARS 2025 / arXiv 2024	arXiv	GitHub, DLR dataset	基于 EnMAP 的全球多时相 HSI 预训练集，带 land-cover、crop-type、tree-species 下游数据，适合研究卫星 HSI 到任务数据迁移。
HyperFree: A Channel-adaptive and Tuning-free Foundation Model for HSI	CVPR 2025	CVF	Project, HF	0.4-2.5 μm weight dictionary，强调 tuning-free 与变通道适配，是“少/免微调”强基线。
SpecAware: Spectral-content Aware FM for Multi-sensor HSI Mapping	ISPRS JPRS 2026	ScienceDirect, arXiv	GitHub planned	用 sensor meta-attributes + image semantic features 做统一 embedding，直接对应 cross-sensor transfer。
Cross-Domain Transfer of Hyperspectral Foundation Models	ICPR 2026 / arXiv	arXiv	未见官方代码	明确比较 in-domain training、cross-modality transfer 和 cross-domain transfer；为“遥感 HSI FM 迁移到新域”提供研究框架。
SpectralEarth-FM: Bringing Hyperspectral Imagery into Multimodal EO Pretraining	arXiv 2026	arXiv	待核验	将 EnMAP/EMIT/DESIS 与 Sentinel-2、Landsat 等共址，对跨模态/跨传感器迁移很关键。
HyperFM: Efficient HSI FM with Spectral Grouping	CVPR 2026 Findings / arXiv	arXiv	待核验	面向 PACE-OCI 等长谱段 HSI，突出 spectral grouping 和高效 transfer。
HyperspectralMAE: Fourier-Encoded Dual-Branch MAE	arXiv 2025	arXiv	待核验	在 Hyperion/EnMAP 预训练后迁移到 Indian Pines，适合放入“classic benchmark transfer”比较。

3. 问题由来

3.1 经典 HSI 数据集太小，容易高估迁移能力

Indian Pines、Pavia University、Houston 2013、Salinas 等经典数据集常用于 HSI classification，但它们通常是单场景、单传感器、空间相邻样本强相关。随机抽样时，训练和测试像素可能来自同一地块或相邻区域，模型可以靠局部纹理和空间平滑拿高分。这会掩盖 foundation model 是否真的学到了可迁移谱-空表示。

更稳妥的设置应包括：

random pixel split：保留与旧论文对齐，但只作为可比基线。
spatial block split：减少空间邻近泄漏。
leave-dataset-out：如用 Pavia + Houston + Salinas 适配，再测 Indian Pines。
leave-sensor-out：如 EnMAP / Hyperion / PRISMA / DESIS 之间迁移。
few-shot curve：1/2/5/10/20 samples per class，而不是只报一个 shot。

3.2 大规模预训练域和下游域并不天然一致

SpectralEarth 这类 EnMAP 全球数据能提供大规模 HSI 表示，但其 30m 级卫星空间分辨率、202 bands、全球场景分布，与 AVIRIS/ROSIS/CASI 等经典机载数据差异很大。HyperSIGMA 的 HyperGlobal-450K 覆盖 EO-1 和 GF-5B 等全球 HSI，也仍会面对传感器响应、空间尺度、处理级别、噪声和地物体系差异。

因此，transfer 需要拆成两个层面：

spectral transfer：中心波长、band width、SRF、噪声和缺失 band 能否对齐。
semantic/spatial transfer：地物类别、空间分辨率、地块尺度和纹理是否可迁移。

3.3 迁移策略的公平比较还不充分

很多论文比较“预训练 vs 从头训练”，但没有系统比较：

冻结 backbone 的 linear probe 是否已经足够。
只调 adapter/LoRA 能否接近 full fine-tuning。
full fine-tuning 的收益是否来自过拟合。
tuning-free/prompt-based 方法在不同传感器和不同 shot 下是否稳定。
同样训练预算下，哪种方法更省标注、更省显存、更稳。

4. 方法路线比较

迁移策略	做法	优点	风险	适合数据
Linear probe	冻结 HSI-FM，只训练分类头或浅层 decoder	最能测表示质量，低过拟合，便宜	不能修正传感器/类别差异；对小数据上限有限	Indian Pines/Pavia/Houston few-shot baseline
Adapter	在 backbone block 中插入小模块	参数少，可适配新域	adapter 位置、瓶颈维度、初始化影响大	cross-dataset、cross-sensor 小样本
LoRA	对 attention/MLP 权重加低秩更新	参数效率高，便于多域保存	rank 选择敏感，可能仍过拟合空间 split	多数据集多任务微调
Prompt / tuning-free	类似 HyperFree，用 prompt 或动态 embedding 直接适配	训练成本低，适合变 band	对类别定义和 prompt 质量敏感	快速迁移、无标注/极少标注
Full fine-tuning	全模型更新	上限高	小数据最容易过拟合，算力和存储重	有足够标签、严格 spatial split
Cross-domain pre-adaptation	先在目标传感器未标注数据上 SSL/TTA，再少样本监督	可缓解传感器 shift	训练流程复杂，可能引入伪标签偏差	EnMAP/PRISMA/Hyperion 到本地任务

5. 推荐实验协议

5.1 模型候选

SpectralGPT：早期 TPAMI 谱域 FM，作为大模型 generative pretraining baseline。
S2MAE / HSIMAE：MAE 系 spectral-spatial baseline。
HyperSIGMA：强 HSI FM 主基线，分别测试 spatial MAE、spectral MAE 与融合特征。
SpectralEarth pretrained models：卫星 EnMAP 预训练基线。
HyperFree：tuning-free/channel-adaptive 强基线。
如果可得：SpecAware、SpectralEarth-FM、HyperFM。

5.2 数据集分层

经典小数据：

Indian Pines：农业场景，小图、类别不平衡、空间相关强。
Pavia University / Pavia Center：城市区域，ROSIS 数据，类别较少但空间结构明显。
Houston 2013：城市 HSI，多类地物，常用于分类。
Salinas：农业场景，类别相对规整。

较大或更现实数据：

WHU-Hi 系列：大尺度机载 HSI，可测试空间泛化。
SpectralEarth downstream：EnMAP-CORINE、EnMAP-NLCD、EnMAP-CDL、EnMAP-BD Foret 等。
PRISMA / EnMAP / DESIS / Hyperion 公开片区：用于 leave-sensor-out。

5.3 Split 与 shot 设置

建议每个数据集至少跑 4 组：

Random pixel split：和旧工作对齐。
Spatial block split：按空间块划分，防止相邻像素泄漏。
Few-shot class-balanced：1/2/5/10/20 samples per class。
Leave-dataset-out / leave-sensor-out：源域若干数据集训练，目标域只 linear probe 或 few-shot adapter。

5.4 指标

分类指标：

OA / AA / Kappa。
macro-F1，避免大类主导。
per-class F1，重点看少样本和长尾类别。

迁移与稳健性指标：

transfer gain：相对从头训练的提升。
few-shot AUC：shot 数从 1 到 20 的曲线面积。
overfit gap：train vs validation/test，尤其 spatial split。
parameter efficiency：可训练参数比例、显存、训练时间。
sensor shift drop：同模型从 source sensor 到 target sensor 的性能下降。

6. 可投稿研究方案

标题草案

How Should Hyperspectral Foundation Models Transfer? A Parameter-Efficient and Leakage-Aware Protocol for Cross-Dataset HSI Adaptation

核心假设

在经典 HSI 小数据上，full fine-tuning 的表观优势很大一部分来自空间泄漏和过拟合；在 spatial split / leave-dataset-out 设置下，adapter 或 LoRA 可以以更少参数获得更稳定的跨数据集迁移，而 linear probe 是最可信的表示质量下界。

方法模块

统一 HSI 输入适配：把不同数据集 band 信息标准化为 wavelength metadata；对缺失/不匹配 band 用 interpolation 或 learned band projection。
迁移策略套件：linear probe、adapter、LoRA、full fine-tuning、HyperFree-style tuning-free。
泄漏感知 split：实现 random、spatial block、leave-dataset-out、leave-sensor-out。
过拟合诊断：记录 train/test gap、feature CKA、类别混淆、空间错误热力图。
样本效率曲线：按 shot 数和可训练参数量画 performance-cost frontier。

最小可行实验

第一阶段：

数据：Indian Pines、Pavia University、Houston 2013、Salinas。
模型：HSIMAE、SpectralGPT、HyperSIGMA。
策略：linear probe、LoRA、full fine-tune。
目标：验证 full fine-tune 在 random split 上更强，但在 spatial split 下 gap 缩小或不稳定。

第二阶段：

加入 SpectralEarth downstream 或 WHU-Hi。
加入 adapter 与 HyperFree。
做 leave-dataset-out。

第三阶段：

加入 EnMAP/PRISMA/DESIS/Hyperion 传感器迁移。
测 missing band 和 spectral response mismatch。

7. 风险与规避

风险	表现	规避
数据 split 泄漏	random split 分数虚高	强制 spatial block split，报告地理距离
代码不可复现	权重或数据不可下载	先选 HyperSIGMA、SpectralGPT、HSIMAE、SpectralEarth 这类开源项目
band 对齐不公平	不同模型输入 band 数不一致	统一记录 band subset、插值方式和 wavelength metadata
full fine-tune 过拟合	小数据高 train acc、低 OOD	early stopping、weight decay、冻结层对照、重复 seed
计算成本高	大模型多 split 难跑	先 ViT-B/小模型，LoRA rank 4/8/16，减少全参微调
旧 benchmark 结论不稳	不同论文 split 不同	发布 split 文件和脚本，重复 5 seeds

8. 推荐阅读顺序

HyperSIGMA GitHub：先确认模型权重、任务脚本和 HyperGlobal-450K 说明。
SpectralEarth arXiv 与 DLR dataset page：理解大规模 EnMAP 预训练与下游任务。
HyperFree CVPR 2025：作为 tuning-free / channel-adaptive 迁移路线。
Cross-Domain Transfer of Hyperspectral Foundation Models：直接对应跨域迁移问题。
HSIMAE GitHub：借用 5/10/15/20 samples per class 的小样本协议。
SpectralGPT GitHub：作为 TPAMI 2024 谱域 FM 基线。

9. 最终建议

RS-33 不建议做“我又提出一个 HSI 分类网络”。更好的论文形态是：提出一个 迁移评测协议 + 参数高效适配方法 + 泄漏/过拟合诊断。如果方法部分要有明确创新，可以做一个 Wavelength-aware LoRA/Adapter：LoRA rank 或 adapter gate 由 band metadata、sensor id 和目标域少量统计量动态调节。这样问题足够细，又能连接 HyperSIGMA/SpectralEarth/HyperFree/SpecAware 这条 2024-2026 的主线。

Contents

RS-33 Hyperspectral Foundation Model Transfer

RS-33 Hyperspectral Foundation Model Transfer

1. 核心判断

2. 代表论文与资源

3. 问题由来

3.1 经典 HSI 数据集太小，容易高估迁移能力

3.2 大规模预训练域和下游域并不天然一致

3.3 迁移策略的公平比较还不充分

4. 方法路线比较

5. 推荐实验协议

5.1 模型候选

5.2 数据集分层

5.3 Split 与 shot 设置

5.4 指标

6. 可投稿研究方案

标题草案

核心假设

方法模块

最小可行实验

7. 风险与规避

8. 推荐阅读顺序

9. 最终建议

Related Content

评论

RS-33 Hyperspectral Foundation Model Transfer

RS-33 Hyperspectral Foundation Model Transfer

1. 核心判断

2. 代表论文与资源

3. 问题由来

3.1 经典 HSI 数据集太小，容易高估迁移能力

3.2 大规模预训练域和下游域并不天然一致

3.3 迁移策略的公平比较还不充分

4. 方法路线比较

5. 推荐实验协议

5.1 模型候选

5.2 数据集分层

5.3 Split 与 shot 设置

5.4 指标

6. 可投稿研究方案

标题草案

核心假设

方法模块

最小可行实验

7. 风险与规避

8. 推荐阅读顺序

9. 最终建议

Related Content

DEO：用双教师蒸馏把 DINOv3 的 RGB 语义注入多光谱 GeoFM

Mag1c-SAS + LinkNet：星上甲烷检测先别急着上大模型

Flexible GeoFM：缺 band 鲁棒性可能比单榜最高分更重要

RS-35 Spectral-Text Alignment

RS-34 Missing-Band Reconstruction vs Robust Adaptation

评论