RS-29 On-Orbit Foundation Model Compression

WangTong included in category 遥感基础模型与多模态理解 and series 2024-2026 遥感 AI 细分研究方向

2026-06-07 09:28:00 2026-06-07 09:28:00 947 words 5 minutes

Series - 2024-2026 遥感 AI 细分研究方向

Contents

RS-29 On-Orbit Foundation Model Compression

范围：面向星上/边缘部署的光学/多光谱 GeoFM 压缩实验。默认不以 SAR-only 任务为主；混合模态论文只取其中对光学/多光谱 foundation model 压缩有价值的部分。

1. 研究问题

这个方向的核心问题不是“把模型做小”这么简单，而是：在星上或边缘设备的功耗、内存、延迟、抗辐照、通信和实时决策约束下，如何把 Prithvi/SkySense/Clay/多模态遥感 VLM 等大模型能力压缩成可靠可运行的任务系统。

典型场景包括：

云检测、洪水检测、火点/烧毁区、非法采矿、灾后损毁等事件触发式任务。
星上预筛选：只下传有价值 tile 或事件摘要，减少带宽。
边缘无人机/小卫星实时推理：低延迟、低功耗、可失败回退。
小模型先路由，大模型按需调用：tiny detector/cloud mask/saliency 先判断是否值得使用 GeoFM。

最适合作为论文切口的问题是：GeoFM 压缩后的 accuracy-latency-energy-OOD trade-off 如何被系统评估，并且能否通过 adapter、量化、剪枝、蒸馏和任务路由组合，让压缩模型在真实分布偏移下仍可靠。

2. 问题由来

遥感 foundation model 的规模在 2024-2026 快速变大：SkySense、Prithvi-EO-2.0、Clay、Galileo、TerraMind、AlphaEarth 等都在扩大数据、任务和模态覆盖。但星上部署的约束反过来很硬：

算力约束：星载 CPU/FPGA/低功耗 GPU/NPU 通常远弱于地面训练集群。
内存约束：大 ViT/VLM 的 attention token 和中间激活会超过星上设备内存。
功耗约束：能耗比 FLOPs 更关键，太阳能、热控和任务 duty cycle 都会限制推理频率。
带宽约束：星上 AI 的价值经常不是最终高精度制图，而是减少无效下传。
可靠性约束：辐射、温度、压缩伪影、云雾、传感器漂移和 OOD 会放大量化/剪枝误差。

NASA 2026 关于 Prithvi 的在轨报道和 2025 arXiv 的在轨演示论文说明，这个方向已经从概念验证进入系统工程阶段：压缩版 foundation model 被部署到 Kanyini 卫星和 ISS IMAGIN-e 平台，用于云与洪水相关检测。这给研究带来一个很好的窗口：现在可以围绕“模型压缩 + 在轨约束 + 任务可靠性”做方法论文，而不是只做工程展示。

3. 代表论文与项目

论文/项目	年份/来源	链接	代码/模型	与 RS-29 的关系
NASA: Prithvi Geospatial Foundation Model in Orbit	2026 NASA	NASA official	Prithvi-EO-2.0 GitHub	官方在轨故事线：压缩版 Prithvi 在 Kanyini/ISS IMAGIN-e 做云与洪水检测，是本方向的强动机来源。
First On-Orbit Demonstration of the Applications of Geospatial Foundation Models	2025 arXiv	arXiv	论文页/项目线索	直接讨论 GeoFM 在轨应用，适合作为实验设计和系统指标参考。
Prithvi-EO-2.0	2024 IBM/NASA	arXiv, HF paper	GitHub	GeoFM 压缩对象之一；多时相 HLS/Sentinel-Landsat 语义强，适合做云/洪水/火灾 adapter。
TinyRS-R1: Compact Multimodal Language Model for Remote Sensing	2025 arXiv	arXiv	论文页线索	遥感小型多模态模型方向，适合作为 tiny VLM 或路由模型 baseline。
Optimizing Deep Learning Models for On-Orbit Deployment Through NAS	2025 Scientific Reports	Nature	论文页线索	面向在轨部署的硬件感知 NAS，给出模型大小、延迟、精度 Pareto 思路。
When LVLM Meets Large Remote Sensing Imagery: Coarse-to-Fine Text-Guided Token Pruning	2025 ICCV	CVF	LRS-VQA GitHub	大幅面遥感 VLM 的动态金字塔和文本引导 token pruning，可迁移到星上“只看关键 tile”。
Parameter Efficient Self-Supervised Geospatial Domain Adaptation	2024 CVPR	CVF	论文页	SLR adapters 只训练少量参数，适合作为星上/边缘小样本适配和低存储更新 baseline。
RS-vHeat: Heat Conduction Guided Efficient Remote Sensing Foundation Model	2025 ICCV	CVF	vHeat	高效 backbone 路线，可作为“从源头设计小模型”而非后压缩的对照。
DynamicVis: Efficient Visual Foundation Model for RS Understanding	2025 arXiv	arXiv	GitHub, HF	动态区域感知和高效推理，适合作为大图边缘部署对照。
RS-Mamba for Large Remote Sensing Image Dense Prediction	2024 TGRS/arXiv	arXiv	GitHub	线性复杂度骨干，作为压缩 ViT 的结构替代路线。
RoMA: Scaling up Mamba-based Foundation Models for RS	2025 NeurIPS	OpenReview	GitHub	高效 foundation backbone，对比“压缩已有 ViT”和“训练高效 SSM FM”。
LearnPruner	2026 ICLR	OpenReview	论文页	通用 VLM token pruning，可迁移为遥感 VQA/grounding 的中层剪枝 baseline。
MetaCompress	2026 arXiv	arXiv	GitHub	通用 VLM token compression；适合比较遥感专用剪枝是否真的需要地理/小目标先验。

4. 方法路线比较

路线	适合压缩什么	优点	风险	推荐实验角色
量化	backbone、adapter、decoder、MLP	部署收益直接，可做 INT8/INT4/混合精度	光谱细节、小目标边界和置信度校准可能退化	必选 baseline
结构化剪枝	attention head、MLP channel、ViT block	可减少实际延迟和内存	不同硬件收益不一致，可能破坏跨域鲁棒性	与量化组合
Token pruning / dynamic tiling	大图 VLM、ViT encoder	对万级像素遥感图最有价值	剪掉小目标/罕见目标会造成不可恢复漏检	研究主线之一
蒸馏	大 GeoFM 到小 ViT/Mamba/ConvNeXt	可保留 teacher 语义	teacher 的地理偏差和幻觉会被继承	作为压缩质量核心
LoRA/adapter	下游任务和区域适配	存储小、可快速更新	backbone 仍大；量化后 adapter 交互需测	适合星上任务包
NAS	从头搜索部署友好模型	硬件感知强，Pareto 明确	搜索成本高，迁移到新任务需重做	可作为系统上界
Tiny-to-large routing	任务系统	省能耗/带宽，便于回退	路由漏检会压低上限	很适合论文创新
高效骨干替代	RS-Mamba/RoMA/RS-vHeat/DynamicVis	结构上减少复杂度	与强 GeoFM teacher 的语义差距需验证	对照路线

5. 可投稿实验设计

题目草案：Risk-Calibrated Compression of Geospatial Foundation Models for On-Orbit Optical Remote Sensing

5.1 核心假设

仅用 accuracy 压缩 GeoFM 会高估星上可用性；必须同时评估 latency、energy、memory、downlink saving 和 OOD robustness。
对遥感大图，最危险的压缩不是权重量化，而是 tile/token pruning 导致的不可恢复漏检。
用不确定性和小目标/云/变化先验约束的 dynamic routing，可以在相同能耗下比静态压缩模型更可靠。

5.2 模型候选

Teacher:

Prithvi-EO-2.0 300M/600M。
SkySense 或 Clay 作为开源/半开源对照。
对 VLM 任务可选 LRS-VQA 相关 LVLM 或 TinyRS-R1 teacher/student 组合。

Student:

MobileViT/ConvNeXt-T/ViT-Tiny/Mamba-tiny/RS-vHeat-small。
Prithvi encoder + LoRA/adapter + small decoder。
tiny cloud/event router + compressed GeoFM cascade。

压缩配置：

FP16 baseline。
INT8 post-training quantization。
INT4/混合精度量化。
结构化 pruning 25/50/75%。
token pruning 25/50/75%，带风险校准。
teacher-student distillation：feature distillation、logit distillation、mask distillation。
LoRA rank 4/8/16，adapter bottleneck 32/64/128。

5.3 任务与数据集

优先选择光学/多光谱，并覆盖“星上有实际价值”的事件任务：

任务	数据集候选	指标
云检测	HLS/Sentinel-2 cloud mask、Prithvi demo 相关数据、S2 cloud datasets	mIoU、F1、cloud false negative rate
洪水/水体	Sen1Floods11 中光学分支、WorldFloods、Sentinel-2 flood scenes	IoU、recall、event-level miss rate
火灾/烧毁区	Burned area Sentinel-2/Landsat 数据、Fire scars datasets	IoU、F1、OOD by region
土地覆盖	Chesapeake/EuroSAT/BigEarthNet/PhilEO/PANGAEA tasks	accuracy、mIoU、spatial OOD
大图 VQA/事件路由	LRS-VQA 或自建大幅面 tile task	answer acc、evidence recall、token saving

说明：如果使用 Sen1Floods11 这类混合模态数据，实验应明确只使用光学输入或把 SAR 设为额外低优先对照，避免偏离当前任务范围。

5.4 硬件指标

论文中应报告两类指标：算法指标和部署指标。

算法指标：

accuracy、mIoU、F1、AP、AUROC。
OOD drop：跨地区、跨季节、跨传感器、跨 GSD。
calibration：ECE、Brier score、risk-coverage curve。
small-object/event recall：星上任务最怕漏检。

部署指标：

模型大小：MB，参数量。
峰值内存：MB。
推理延迟：ms/tile、s/scene。
能耗：J/tile、J/scene，或功耗 x 延迟近似。
吞吐：km2/s 或 tiles/s。
下传节省：需要下传 tile 比例、事件触发准确率。
duty cycle：单位轨道周期可处理图像数。
回退率：router 不确定时调用大模型或下传原图的比例。

硬件建议：

地面模拟：Jetson Orin Nano/NX、Raspberry Pi + Coral、Intel/ARM CPU。
更接近星载：RISC-V/FPGA/NPU 模拟环境，或使用公开 on-board AI benchmark 的等价功耗设置。
若没有真实硬件，至少使用 ONNX Runtime/TensorRT 的延迟与峰值内存，并报告测量环境。

6. 失败模式

漏检比误检更致命：cloud/flood/fire/event routing 中，压缩模型漏掉关键区域会导致无法下传原始数据。
小目标被 token pruning 剪掉：飞机、船、窄水体、局部火点、建筑损毁很容易在粗分辨率 overview 中消失。
量化破坏置信度校准：accuracy 下降不大，但 uncertainty 失真，无法可靠触发回退。
蒸馏继承 teacher 偏差：teacher 在某气候带或城市形态下错，student 会更自信地错。
压缩模型 OOD drop 更大：新地区、新传感器、新季节下压缩误差被放大。
FLOPs 不等于能耗：非结构化剪枝在真实硬件上可能无收益，memory bandwidth 反而成为瓶颈。
星上环境缺少人工修复：模型输出需要 watchdog、fallback 和可追踪日志。

7. 最小实现路线

阶段 A：地面可复现 baseline

选 Prithvi-EO-2.0 或 Clay encoder。
选择云检测或洪水检测作为第一个任务。
建立 FP16 baseline：linear probe / small decoder / LoRA adapter。
添加 INT8 和 INT4 量化。
添加 small student distillation。
在同一数据划分上报告 accuracy、mIoU、latency、memory。

阶段 B：风险感知压缩

对大图引入 dynamic tiling/token pruning。
对每个 tile 输出 risk score：uncertainty、saliency、小目标先验、cloud/event likelihood。
设计 fallback：高风险 tile 不剪枝或调用 teacher。
报告 risk-coverage-energy 曲线。

阶段 C：星上任务系统模拟

模拟轨道批处理：输入一批时序影像 tile。
tiny router 先判断 cloud/event/no-interest。
compressed GeoFM 处理疑似事件 tile。
只有高价值 tile 下传。
输出 downlink saving、event miss rate、energy per detected event。

8. 推荐实验矩阵

组别	模型	压缩	路由	主要验证
B0	Prithvi/Clay FP16	无	无	teacher 上界
B1	Prithvi/Clay	INT8	无	基础部署收益
B2	Prithvi/Clay	INT4/mixed	无	极限量化风险
B3	Small ViT/Mamba	distillation	无	student 能力
B4	Prithvi/Clay + LoRA	INT8 + LoRA	无	少参数任务包
B5	B1/B3	token pruning	无	大图加速
B6	B1/B3	token pruning	uncertainty fallback	风险感知剪枝
B7	tiny router + B6	cascade	有	星上系统收益
B8	NAS small model	searched	有/无	硬件感知上界

核心图表：

accuracy-latency-energy Pareto。
OOD drop vs compression ratio。
event recall vs downlink saving。
calibration curve before/after quantization。
small-object recall vs token pruning ratio。

9. 可能的创新点

Risk-calibrated token pruning：剪枝模块不仅输出保留 token，还输出漏检风险；风险高则保留高分辨率 tile 或触发回退。
Quantization-aware geospatial adapter：只让少量 adapter 保持 FP16/BF16，backbone INT8/INT4，保护光谱/时序细节。
Teacher-student-router 三元蒸馏：teacher 教 student 特征，teacher 同时教 router 判断何时不该压缩。
On-orbit evaluation protocol：把 event miss rate、downlink saving、J/event、OOD drop 和 calibration 纳入统一 benchmark。
Failure replay buffer：星上保存高不确定/疑似失败 tile，下传后用于地面再训练 adapter。

10. 推荐论文方案

论文标题候选：

Risk-Calibrated Compression of Geospatial Foundation Models for On-Orbit Optical Remote Sensing
Tiny-to-Reliable: Energy-Aware GeoFM Compression with Uncertainty Fallback for Satellite Edge Inference
Beyond FLOPs: Evaluating Compressed Earth Observation Foundation Models under On-Orbit Constraints

方法模块：

Compressed GeoFM backbone：Prithvi/Clay + INT8/INT4 + LoRA。
Distilled student：small ViT/Mamba/RS-vHeat。
Risk-aware tile/token selector：uncertainty + saliency + small-object prior。
Tiny router：cloud/event/no-interest triage。
Fallback policy：high-risk tile uses teacher or downlinks raw patch.

预期贡献：

一个面向星上约束的 GeoFM 压缩 benchmark protocol。
一个风险感知压缩和回退方法。
一组比单纯 accuracy/FLOPs 更真实的部署指标。
对 Prithvi/Clay 等公开模型的可复现实验脚本。

11. 下一步阅读队列

12. 结论

RS-29 最值得继续推进的不是单点压缩技巧，而是风险感知的星上 GeoFM 任务系统：用压缩 GeoFM 提供语义能力，用 tiny router 和 uncertainty fallback 控制漏检风险，用 energy/downlink/OOD/calibration 指标替代只看 FLOPs 的评价。这个切口足够细，也贴近 2026 已经出现的 Prithvi in Orbit 趋势，具备 TGRS、ISPRS JPRS、CVPR/ICCV workshop 或应用型顶刊的投稿潜力。

Contents

RS-29 On-Orbit Foundation Model Compression

RS-29 On-Orbit Foundation Model Compression

1. 研究问题

2. 问题由来

3. 代表论文与项目

4. 方法路线比较

5. 可投稿实验设计

5.1 核心假设

5.2 模型候选

5.3 任务与数据集

5.4 硬件指标

6. 失败模式

7. 最小实现路线

阶段 A：地面可复现 baseline

阶段 B：风险感知压缩

阶段 C：星上任务系统模拟

8. 推荐实验矩阵

9. 可能的创新点

10. 推荐论文方案

11. 下一步阅读队列

12. 结论

Related Content

评论

RS-29 On-Orbit Foundation Model Compression

RS-29 On-Orbit Foundation Model Compression

1. 研究问题

2. 问题由来

3. 代表论文与项目

4. 方法路线比较

5. 可投稿实验设计

5.1 核心假设

5.2 模型候选

5.3 任务与数据集

5.4 硬件指标

6. 失败模式

7. 最小实现路线

阶段 A：地面可复现 baseline

阶段 B：风险感知压缩

阶段 C：星上任务系统模拟

8. 推荐实验矩阵

9. 可能的创新点

10. 推荐论文方案

11. 下一步阅读队列

12. 结论

Related Content

Mag1c-SAS + LinkNet：星上甲烷检测先别急着上大模型

RS-30 Tiny Model Task Routing for EO

RS-28 Mamba/SSM Backbones for Dense Remote Sensing Prediction

RS-27 DIP with GIS Priors for Tile Selection

RS-26 Risk-Aware Token Pruning for Large Remote Sensing VLMs

评论