星上部署 - Tag - 堂堂一跑堂

Mag1c-SAS + LinkNet：星上甲烷检测先别急着上大模型

Sun, 14 Jun 2026 21:00:02 +0800

Mag1c-SAS + LinkNet：星上甲烷检测先别急着上大模型

结论：这一轮最值得单独跟踪的是 A Fast Methane Detection Pipeline on Board Satellites Based on Mag1c-SAS and LinkNet。它不是继续把高光谱甲烷检测做成更重的地面后处理模型，而是把问题倒过来问：如果卫星下行带宽、CPU、内存和功耗都很紧，能不能在星上先把 3D 高光谱立方体压成可用的甲烷候选图，再只下传真正值得看的区域？论文给出 Mag1c-SAS 这个加速版甲烷增强产品，再用轻量 LinkNet 清噪；在 STARCOP 和作者新构建的 EMIT-MSeg 上验证，并发布 PyPI 库、实验代码、模型和数据。对遥感 AI 来说，它的价值不在于“又一个分割网络”，而在于给高光谱星上智能提供了一个可部署、可复现、可替换目标谱的工程模板。

我按 2026-06-14 21:00 +08 检索公开来源，过滤 SAR、PolSAR、InSAR、radar-only、microwave-only 和 SAR-optical fusion 主线工作。本篇选择 2026-06-02 提交 arXiv 的高光谱光学遥感工作。它使用 AVIRIS-NG 和 EMIT 这类 imaging spectroscopy / hyperspectral 数据，不属于雷达方向；同时有 arXiv HTML、PyPI 包、GitHub 项目和 Hugging Face 模型页可核验，适合进入“多源数据融合、效率部署与应用落地”。

这篇也值得和最近一批 VLM / GeoFM 文章区分开。VLM 方向的热点是“让模型看懂遥感图像并会说话”，而这篇关注的是“卫星真的能不能在轨先算出有用结果”。它提醒我们：遥感 AI 不只是在云端跑更大的模型，很多高价值任务最后要落到带宽、功耗、处理器和任务调度上。对于甲烷、火点、船舶、云雪、灾害初筛等任务，星上先做低成本筛选，再把有限下行资源留给异常区域，可能比一味追求地面模型精度更接近系统收益。

背景

甲烷点源检测是高光谱遥感里很典型的“数据量大、信号弱、响应要快”的任务。甲烷在短波红外有明确吸收特征，尤其在约 2100-2500 nm 范围内可被 AVIRIS-NG、EMIT、PRISMA、EnMAP、CHIME 等成像光谱数据利用。但高光谱图像不是 RGB 三通道，而是几十到几百个波段的立方体。把完整数据下传到地面再处理，延迟和带宽成本都高；如果卫星只拍人工指定区域，又容易错过突发泄漏。

RS-30 Tiny Model Task Routing for EO

Sun, 07 Jun 2026 09:29:00 +0800

RS-30 Tiny Model Task Routing for EO

范围：星上或边缘端的光学/多光谱遥感任务路由。核心问题是：先用轻量 cloud mask、saliency、tiny detector 或低分辨率模型判断是否调用大模型、是否下传图像、是否触发灾害回退机制，从而节省能耗和带宽，同时控制漏检风险。

1. 方向概述

星上 AI 的早期目标通常是“把一个小模型塞进 CubeSat/边缘硬件”。但 2024-2026 的趋势正在变成“级联式任务路由”：轻量模型先做快速筛选，大模型或下传链路只处理高价值、高风险或不确定样本。这样的问题比单纯模型压缩更像一个决策系统：

输入端：低分辨率 quick-look、压缩预览、云量估计、saliency map、tiny detector、元数据、任务优先级。
路由端：决定丢弃、压缩下传、调用中等模型、调用大模型、或触发灾害/异常回退。
输出端：省电、省带宽、低延迟，同时保证云、洪水、火点、船只、道路损毁等关键事件不被漏掉。

这个方向的研究价值在于：真实星上/边缘约束不是一个静态 FLOPs 约束，而是动态的电量、热、存储、下传窗口、任务优先级和风险预算。一个可投稿的小题可以围绕“风险感知 tiny-to-large cascade for EO”展开。

2. 代表论文与项目

标题/项目	年份/venue	链接	代码/模型	与 RS-30 的关系
NASA’s Prithvi Becomes First AI Geospatial Foundation Model In Orbit	2026 NASA	NASA Science	Prithvi-EO-2.0 GitHub	压缩版 Prithvi 已在 Kanyini 与 ISS IMAGIN-e 上测试云/洪水检测，说明“压缩 FM 上轨 + 任务触发”已进入实证阶段。
Prithvi-EO-2.0	2024 arXiv / NASA-IBM	arXiv	GitHub, HF	可作为大模型分支或 teacher；300M/600M 版本适合研究压缩、LoRA、蒸馏。
Φsat-2	2024 ESA mission	ESA mission, Introducing Φsat-2	PhiSat-2 GitHub org	6U CubeSat，星上运行 cloud detection、vessel detection、wildfire、marine anomaly、compression 等应用，是任务路由系统的现实原型。
Φsat-2 gets two new AI apps	2024 ESA	ESA	mission apps	明确提出云去除、应急街图、船只检测、海洋污染、野火检测等多 app 场景，适合抽象成 onboard scheduler。
Optimizing Deep Learning Models for On-Orbit Deployment Through Neural Architecture Search	2025 Scientific Reports	Nature	未见官方代码	硬件/任务约束下的 NAS，给级联系统里的 tiny/mid 模型选型提供方法基础。
Efficient FPGA-accelerated CNNs for Cloud Detection on CubeSats	2025 arXiv	arXiv	未见官方代码	云检测是最自然的第一级路由器；论文报告在 Zynq UltraScale+ MPSoC 上用 FPGA/DPU 实现实时云检测。
TinyRS-R1: Compact Multimodal Language Model for Remote Sensing	2025 arXiv	arXiv	未确认官方代码	2B 遥感多模态小模型，可作为边缘端“轻量语义解释/任务确认”分支，而不是直接调用 7B/13B VLM。
Lightweight Remote Sensing Scene Classification on Edge Devices via Knowledge Distillation and Early-exit	2025 arXiv	arXiv	未见官方代码	early-exit 和蒸馏适合做“简单样本早停，困难样本路由到大模型”。
SatReg: Regression-based NAS for Lightweight Satellite Image Segmentation	2026 arXiv	arXiv	GitHub 未核验	在 Jetson Orin Nano 上拟合 mIoU、latency、power surrogate，适合作为级联系统硬件 cost model。
TA-YOLO	2024 Complex & Intelligent Systems	Springer	未见官方代码	轻量小目标检测，可作为第一级 tiny detector 候选。
LEGNet	2025 arXiv	arXiv	未见官方代码	针对低质量遥感图像的轻量目标检测，适合评估噪声/低分辨率 quick-look 下的路由鲁棒性。
MEANet	2024 Expert Systems with Applications	ScienceDirect	未见官方代码	轻量光学遥感 saliency detection，可用于“是否值得下传/是否调用大模型”的 saliency gate。
Lightweight Semantic- and Graph-Guided Network for ORSI-SOD	2025 Remote Sensing	MDPI	未见官方代码	低计算成本 saliency，强调边缘和语义引导，可作为异常/目标候选区域路由器。
IEAM for Remote Sensing Salient Object Detection	2025 Remote Sensing	MDPI	未见官方代码	兼顾边界、注意力和效率，适合与 tiny detector/cloud mask 组合。
LightEMNet	2025 TGRS	CoLab/IEEE record	未见官方代码	弱监督轻量 Mamba-fusion SOD，论文记录显示仅 4.81M 参数，适合 onboard saliency gate。
E4: Energy-Efficient DNN Inference via Early-Exit and DVFS	2025 arXiv	arXiv	未核验	通用边缘视频分析方法，可迁移到星上 EO：根据模型置信度和芯片频率动态控制能耗。
SCTNet-NAS for Cloud-Edge Collaborative Perception	2025 Complex & Intelligent Systems	Springer	未见官方代码	通用 cloud-edge 协同分割框架，可迁移为“星上初筛 + 地面/大模型精处理”。

3. 问题由来

3.1 星上/边缘不是单模型问题

单个轻量模型可以降低延迟，但真实 EO 系统还要决定：

RS-29 On-Orbit Foundation Model Compression

Sun, 07 Jun 2026 09:28:00 +0800

RS-29 On-Orbit Foundation Model Compression

范围：面向星上/边缘部署的光学/多光谱 GeoFM 压缩实验。默认不以 SAR-only 任务为主；混合模态论文只取其中对光学/多光谱 foundation model 压缩有价值的部分。

1. 研究问题

这个方向的核心问题不是“把模型做小”这么简单，而是：在星上或边缘设备的功耗、内存、延迟、抗辐照、通信和实时决策约束下，如何把 Prithvi/SkySense/Clay/多模态遥感 VLM 等大模型能力压缩成可靠可运行的任务系统。

典型场景包括：

云检测、洪水检测、火点/烧毁区、非法采矿、灾后损毁等事件触发式任务。
星上预筛选：只下传有价值 tile 或事件摘要，减少带宽。
边缘无人机/小卫星实时推理：低延迟、低功耗、可失败回退。
小模型先路由，大模型按需调用：tiny detector/cloud mask/saliency 先判断是否值得使用 GeoFM。

最适合作为论文切口的问题是：GeoFM 压缩后的 accuracy-latency-energy-OOD trade-off 如何被系统评估，并且能否通过 adapter、量化、剪枝、蒸馏和任务路由组合，让压缩模型在真实分布偏移下仍可靠。

2. 问题由来

遥感 foundation model 的规模在 2024-2026 快速变大：SkySense、Prithvi-EO-2.0、Clay、Galileo、TerraMind、AlphaEarth 等都在扩大数据、任务和模态覆盖。但星上部署的约束反过来很硬：

算力约束：星载 CPU/FPGA/低功耗 GPU/NPU 通常远弱于地面训练集群。
内存约束：大 ViT/VLM 的 attention token 和中间激活会超过星上设备内存。
功耗约束：能耗比 FLOPs 更关键，太阳能、热控和任务 duty cycle 都会限制推理频率。
带宽约束：星上 AI 的价值经常不是最终高精度制图，而是减少无效下传。
可靠性约束：辐射、温度、压缩伪影、云雾、传感器漂移和 OOD 会放大量化/剪枝误差。

NASA 2026 关于 Prithvi 的在轨报道和 2025 arXiv 的在轨演示论文说明，这个方向已经从概念验证进入系统工程阶段：压缩版 foundation model 被部署到 Kanyini 卫星和 ISS IMAGIN-e 平台，用于云与洪水相关检测。这给研究带来一个很好的窗口：现在可以围绕“模型压缩 + 在轨约束 + 任务可靠性”做方法论文，而不是只做工程展示。

RS-28 Mamba/SSM Backbones for Dense Remote Sensing Prediction

Sun, 07 Jun 2026 09:27:00 +0800

RS-28 Mamba/SSM Backbones for Dense Remote Sensing Prediction

范围：2024-2026 光学/航空/卫星遥感 dense prediction，重点是语义分割、二值/语义变化检测、大幅面高分辨率理解；不把 SAR-only 作为主线。

1. 方向概述

Mamba/SSM 在遥感 dense prediction 中兴起的直接原因，是高分辨率遥感图像同时需要“全局上下文”和“可承受的长序列计算”。CNN 的局部感受野不够，ViT/Transformer 的全局注意力又在万级像素或大 patch 序列上成本很高；遥感影像还存在俯视方向任意、目标尺度差异大、背景占比高、小目标稀疏等问题。2024 年 Vim 和 VMamba 把选择性状态空间模型迁移到视觉，随后 Samba、RS3Mamba、RS-Mamba、ChangeMamba 几乎在同一时间把 SSM 带进遥感分割和变化检测。

这个方向的研究重点已经从“把 Mamba 换进 backbone”逐步变成三个更细的问题：

扫描方向：遥感目标没有固定上/下/左/右语义，2D/多方向/全向扫描是否真的必要，何时比普通 bidirectional scan 更好。
全局-局部平衡：Mamba 擅长长程建模，但 dense prediction 需要边界、纹理和小目标细节，很多新方法开始重新引入 CNN、多尺度金字塔、频域和局部卷积。
任务结构：语义分割是单时相 dense labeling，变化检测还要建模双时相/多时相交互，不能只把两张图分别编码后相减。

2. 代表论文与代码

方向	论文/项目	年份/来源	链接	代码/资源	核心贡献
通用视觉 SSM	Vision Mamba (Vim)	2024 arXiv/ICML 方向	arXiv	GitHub	用 bidirectional Mamba blocks 处理图像序列，是遥感 Mamba 的重要通用基座。
通用视觉 SSM	VMamba: Visual State Space Model	2024 NeurIPS spotlight	arXiv	GitHub	提出 SS2D，用四条扫描路线连接 1D selective scan 与 2D 图像结构，后续 ChangeMamba/M-CD 等直接基于它。
RS 语义分割	Samba: Semantic Segmentation of Remotely Sensed Images with State Space Model	2024 arXiv / Heliyon	arXiv	GitHub	Encoder-decoder + Samba blocks + UperNet，在 LoveDA、Vaihingen、Potsdam 上验证 SSM 做高分遥感分割。
RS 语义分割	RS3Mamba	2024 arXiv/GRSL	arXiv	GitHub	双分支结构：CNN 主分支保局部细节，VSS 辅助分支补全局信息，CCM 融合两类特征。
RS dense prediction	RS-Mamba for Large Remote Sensing Image Dense Prediction	2024 arXiv/TGRS	arXiv	GitHub	面向大幅面 VHR 图像，提出 omnidirectional selective scan；同一框架覆盖语义分割和变化检测。
RS 语义分割	PyramidMamba	2024 arXiv	arXiv	GeoSeg	用 selective state space model 重做金字塔特征融合，缓解多尺度特征语义冗余。
RS 语义分割	MF-Mamba	2025 TGRS	DLR entry	GitHub	CNN encoder + Mamba decoder，GLSS 八方向扫描 + 多核卷积，强调 global-local 和多尺度融合。
RS 语义分割	UrbanSSF	2025 ISPRS JPRS	ScienceDirect	未核验到官方代码	FSI-Mamba 建模不同 feature state 的序列关系，面向 VHR 城市场景分割和应用落地。
RS foundation model	RoMA	2025 NeurIPS	arXiv, OpenReview	GitHub	系统验证 Mamba 在遥感预训练中的 data/parameter scaling law；覆盖分类、检测、分割。
RS foundation model	DynamicVis	2025 arXiv	arXiv	GitHub	selective region-aware SSM + MIL meta-embedding，面向高分大图和跨任务 foundation model。
变化检测	ChangeMamba	2024 TGRS	arXiv	GitHub	基于 VMamba，分别给 BCD/SCD/BDA 设计 MambaBCD/MambaSCD/MambaBDA，重点是时空交互建模。
变化检测	CDMamba	2024/2025 arXiv	arXiv	GitHub	指出纯扫描改造忽略局部细节，提出 Scaled Residual ConvMamba 和双时相 global-local guided fusion。
变化检测	A Mamba-Based Siamese Network for Remote Sensing Change Detection	2025 WACV	CVF PDF, arXiv	GitHub	Siamese VMamba encoder + difference module + Mamba decoder，在 4 个变化检测数据集上验证。
语义变化检测	GSTM-SCD	2025 ISPRS JPRS	ScienceDirect	GitHub	Graph-enhanced spatio-temporal Mamba，支持 bi-temporal 和 time-series SCD，并加入时序拓扑一致性。
语义变化检测	Mamba-FCS	2025 arXiv / 2026 JSTARS 方向	arXiv	GitHub	将频域特征、change-guided attention 和 SeK-inspired loss 融入 Mamba SCD。

3. 方法脉络比较

3.1 扫描策略

Vim：把图像 token 当序列，使用双向 Mamba；优点是简单、通用，缺点是 2D 空间结构依赖展开顺序。
VMamba：SS2D 四方向扫描，是多数遥感变化检测 Mamba 的通用底座。
RS-Mamba：针对遥感俯视方向任意，提出全向/多方向 selective scan，强调大幅面全局上下文。
MF-Mamba：进一步使用八方向扫描，并配合多核卷积补局部纹理。
GSTM-SCD：把扫描扩展到多时相语义变化，加入双向三维变化扫描和图关系。

判断：扫描方向不是越多越好。多方向扫描提升上下文覆盖，但也带来实现复杂度、显存和重复语义。真正值得做的实验是“方向数量/方向选择是否与目标形态、场景结构、GSD 和任务类型相关”。

RS-27 DIP with GIS Priors for Tile Selection

Sun, 07 Jun 2026 09:26:00 +0800

RS-27 DIP with GIS Priors for Tile Selection

细问题：把 dynamic image pyramid / coarse-to-fine tile selection 与 GIS 先验结合，让道路、水系、建筑密度、历史变化热力图、POI 等外部地理信息指导高分辨率 tile 选择，用于遥感 VQA 和 visual grounding。

结论先行

这个方向的研究空位比较清晰：ICCV 2025 的 LRS-VQA / Dynamic Image Pyramid 已经证明“大幅面遥感 VLM 不能直接缩放整图，需要 coarse-to-fine tile selection 和 text-guided token pruning”。但它的 selection 主要依赖图像和文本相关性；遥感任务天然有 GIS 层，例如道路、水体、建筑 footprint、POI、地块、历史变化区域。当前还缺一个系统研究：这些 GIS 先验如何进入 tile selection，什么时候帮忙，什么时候导致模型偷看地图或被过期地图误导。

最值得做的小论文题目可以是：

GeoPrior-DIP: GIS-prior guided dynamic image pyramid for evidence-grounded remote sensing VQA and visual grounding.

核心假设：在大幅面遥感图像中，若问题和地理关系相关，例如“道路旁的受损建筑”“靠近水体的施工区域”“机场附近的飞机”“高建筑密度区域中的停车场”，把 GIS prior 作为 tile selection 的软约束，可以在相同高分辨率 tile budget 下提升 evidence tile recall、grounding IoU 和 VQA accuracy；但必须加入 image-only / GIS-only / noisy-GIS 对照，避免模型只靠地图先验猜答案。

RS-26 Risk-Aware Token Pruning for Large Remote Sensing VLMs

Sun, 07 Jun 2026 09:25:00 +0800

RS-26 Risk-Aware Token Pruning for Large Remote Sensing VLMs

1. 方向概述

大幅面遥感图像的矛盾很尖锐：一张卫星或航拍图可以达到几千到几万像素边长，但 VLM 的视觉 token budget 通常按自然图像设计。若直接缩小整图，小目标、细道路、灾损建筑、车辆、飞机等证据会消失；若全图切 tile，再把大量 tile token 送入 VLM，显存、延迟和上下文长度都会爆炸；若只按 attention 或文本相关性剪 token，又可能把真正的答案区域提前剪掉。

因此 RS-26 的核心不是“怎样剪得更多”，而是“怎样知道哪些 token 不能剪”。遥感场景尤其需要风险感知：目标稀疏、长尾类别多、问题可能指向图像中很小的区域，且背景纹理和地物重复度高。一个可投稿的小问题可以定义为：

在大幅面遥感 VQA/grounding 中，token pruning 不只优化保留率和推理速度，还要显式估计被剪 token 中包含答案证据、小目标或罕见类别的风险，并在速度-精度-漏检风险之间自适应取舍。

2. 代表论文与项目

论文/项目	年份/来源	链接	官方代码/数据	与 RS-26 的关系
When Large Vision-Language Model Meets Large Remote Sensing Imagery: Coarse-to-Fine Text-Guided Token Pruning	ICCV 2025	CVF	LRS-VQA GitHub	遥感专用核心基线。提出 Dynamic Image Pyramid 和 coarse-to-fine text-guided token pruning，用问题文本逐层选择高分辨率区域。
LRS-VQA dataset	ICCV 2025 配套	GitHub	同左	大幅面遥感 VQA 数据集，适合直接评测“剪掉证据区域”的失败模式。
DynamicVis: An Efficient and General Visual Foundation Model for Remote Sensing Image Understanding	2025 arXiv	arXiv	GitHub, Hugging Face	遥感高效视觉骨干。不是 VLM token pruning，但其动态区域感知与稀疏目标建模可作为视觉侧风险估计模块。
RS-Mamba for Large Remote Sensing Image Dense Prediction	2024 TGRS/arXiv	arXiv	GitHub	用线性复杂度 SSM 替代全局二次注意力，可作为“不剪 token 但换骨干”的对照。
FastV: Efficient Vision-Language Models with Token Pruning	ECCV 2024 / arXiv	arXiv	GitHub	通用 VLM 快速剪枝基线。依据注意力/冗余在推理早期减少视觉 token，需验证其在遥感小目标上是否漏证据。
PyramidDrop: Accelerating Your Large Vision-Language Models via Pyramid Visual Redundancy Reduction	2024 arXiv	arXiv	GitHub	通用多层级视觉冗余削减。与遥感的 dynamic pyramid 思路相呼应，但需要加入地物稀疏和小目标风险。
ATP-LLaVA: Adaptive Token Pruning for Large Vision Language Models	2024 arXiv	arXiv	GitHub	通用自适应剪枝。可作为问题相关 token 保留的基线，检验是否能处理遥感尺度变化。
LearnPruner	ICLR 2026 OpenReview	OpenReview	OpenReview 页面为主	学习式 token pruning，可迁移为“风险预测器 + 保留策略”的候选框架。
MetaCompress	2026 arXiv	arXiv	GitHub	通用 VLM token compression。适合比较 learned compression 是否比 hard pruning 更少损伤遥感证据。
Nüwa: Mending the Spatial Integrity Torn by VLM Token Pruning	ICLR 2026	OpenReview	OpenReview 页面为主	指出 token pruning 会破坏空间完整性。对遥感尤其关键，因为道路、河流、地块边界等依赖空间连续结构。
IDPruner: Harmonizing Importance and Diversity for Accelerated MLLMs	2025 arXiv/OpenReview	OpenReview	OpenReview 页面为主	同时考虑重要性和多样性。可迁移到遥感中的长尾地物和空间覆盖约束。
VisionZip / TokenPacker 等通用视觉 token 压缩	2024-2025	VisionZip arXiv, TokenPacker arXiv	各项目页/GitHub 需二次核验	可作为 soft compression baseline，但需要评估小目标语义是否被平均掉。

3. 方法谱系

3.1 遥感专用：Dynamic Image Pyramid + Text-Guided Pruning

LRS-VQA/CF-TTP 的关键思路是先看低分辨率全局图，再按问题文本逐层选择高分辨率 tile。它解决了“直接缩小丢小目标”和“全量 tile 太贵”的矛盾，是 RS-26 最重要的起点。