RS-42 Wildfire Mapping with GeoFM LoRA
RS-42 Wildfire Mapping with GeoFM LoRA
细问题:面向 wildfire / burn scar / burn severity mapping,如何用低样本、参数高效的 GeoFM adapter/LoRA 适配 Prithvi、TerraMind、DINOv3、AlphaEarth 等遥感基础模型,并处理 pre/post-fire 光学影像、云烟干扰、不确定性和跨地区泛化。
1. 方向判断
Wildfire mapping 的经典路线是 NBR/dNBR、BAIS2、阈值、随机森林、U-Net/Siamese U-Net、ChangeFormer 一类变化检测模型。2024-2026 的新变化是:基础模型开始进入真正可复现的 wildfire 任务,而不只是“拿 Prithvi 做一个示例”。其中最直接的锚点是 2026 IGARSS 论文 Low-Rank Adaptation of Geospatial Foundation Models for Wildfire Mapping Using Sentinel-2 Data,其官方代码为 alishibli97/wildfire-lora-gfm。
这个方向的研究价值不在于“再做一个烧毁区分割模型”,而在于回答一个更窄的问题:在地理、时间、生态区和传感器条件都变化的情况下,LoRA/adapter 是否比 full fine-tuning 或 decoder-only fine-tuning 更稳,尤其是在小样本事件、云烟遮挡、火后恢复阶段、跨国家/跨生态区泛化时。
2. 问题由来
- 火烧迹地是典型的 bi-temporal change problem。单张 post-fire 影像容易把裸土、采伐地、阴影、火山/矿区等误判为 burned area;pre-fire/post-fire 差分能增强变化信号,但也会引入季节、物候、云影、观测角和配准误差。
- 标签天然有噪声。USGS BARC 数据说明 burn severity 产品通常基于 pre/post-fire 的 dNBR,并且阈值需要 BAER 团队结合现场观察调整;这意味着 severity label 在生态区边界和低/中 severity 类别上并不是绝对真值。
- 跨地区泛化比随机切分难得多。2026 LoRA-GFM 论文使用美国和加拿大 2017-2023 的 3,820 个 wildfire events,并做 spatial/temporal generalization tests;这是该方向从“局部案例”走向“域泛化问题”的关键。
- GeoFM 的预训练知识有用,但灾害任务需要强适配。Prithvi-EO-2.0 预训练于 HLS 全球时间序列,并引入 temporal/location embeddings;这对 wildfire 这种多时相任务很友好,但仍需解决任务头、差分建模和不确定性。
3. 代表论文、模型、数据与代码
| 项目 | 年份/venue | 链接 | 与本方向的关系 |
|---|---|---|---|
| Low-Rank Adaptation of Geospatial Foundation Models for Wildfire Mapping Using Sentinel-2 Data | 2026 IGARSS / arXiv | paper, GitHub | 直接比较 TerraMind、DINOv3、Prithvi-v2 的 full fine-tuning、decoder-only fine-tuning、LoRA;官方 README 显示包含 FPN adapter、UPerNet decoder、spatio-temporal splits、sliding-window full-fire inference、IoU/F1 和 fire-size summaries。 |
| Prithvi-EO-2.0 | 2024 arXiv, 2026 revised | paper, GitHub | 多时相 HLS GeoFM。论文摘要称其使用 4.2M 全球 HLS time-series samples,并提供 Hugging Face、TerraTorch 与 GitHub 资源;适合作为 wildfire LoRA 主干。 |
| Prithvi EO 2.0 Burn Scar Severity Detection | 2024/2025 HF model card | model, dataset | 一个可直接运行的 Prithvi burn scar severity demo。输入为 pre-fire、post-fire、delta 三帧,6 个 Sentinel-2 band,输出 5 类 severity。模型卡自报 macro F1 从 0.116 提升到 0.622,但其限制也明确:单一北加州 wildfire 事件、云烟未评估、20m 分辨率可能漏细节。 |
| HLS Burn Scars Dataset | HF dataset | dataset | HLS 2018-2021 CONUS burn scar segmentation,804 个 512x512 scenes,6 个 band,540 train / 264 validation;适合最小复现实验和 adapter sanity check。 |
| AlphaEarth Foundations | 2025 arXiv / Google DeepMind | paper, blog | 64 维年度 embedding field,面向 sparse labels 的 global mapping。更适合做 linear probe / shallow adapter / sparse-label baseline,而不是端到端 LoRA。可用于 wildfire 小样本或跨区迁移对照。 |
| Burned Area Reflectance Classification (BARC) Thematic Burn Severity Mosaic | 2025 USGS data release | USGS catalog | 权威 severity label 来源之一。基于 Landsat/Sentinel pre/post-fire dNBR,但官方说明 severity 与 canopy/understory/soil effects 相关,且阈值需与现场观测调整,因此很适合讨论标签不确定性。 |
| SAFE: Segmentation of Any Fire Event | 2025 Remote Sensing | paper | 训练自由路线:结合 SAM、MODIS/VIIRS hotspot、Sentinel-2 指数两步定位 burned area,并可生成高分辨率数据再训练区域模型。适合作为伪标签或半自动标注对照。 |
| California Wildfire GeoImaging Dataset (CWGID) | 2024 arXiv | paper | 构建 10 万+ before/after Sentinel-2 image pairs,用于 wildfire detection;偏分类/检测而非高精度 burn mask,但可用于预训练或事件级检索。 |
| Faster, better, and more accurate mapping of burned areas using Sentinel-2 multispectral images | 2025 RSE | ScienceDirect | MSR-BACD 路线:全球大规模正负样本、pre/post Sentinel-2、candidate-based inference。可作为强监督专用模型 baseline。 |
| TransFireNet | 2025 Remote Sensing Letters | publisher | bi-temporal Sentinel-2 burn severity estimation,45 个 European wildfire events;适合作为非 GeoFM 的 burn severity baseline。 |
4. 方法脉络比较
4.1 指数与阈值
NBR/dNBR、BAIS2、NDVI/NDWI 等指数可解释、低成本、部署简单,但跨生态区阈值不稳,对云影、裸土、采伐、湿地和季节变化敏感。BARC 的说明很适合用来支撑一个观点:severity label 不是纯影像数学事实,而是遥感指数、生态效应和现场知识的折中。
4.2 专用深度模型
U-Net/Siamese U-Net/Transformer change models 可以利用 pre/post-fire 差异,在固定区域内通常强于指数阈值。但它们容易学到区域、植被类型和季节偏置;跨国家/跨生态区时需要大量标注。MSR-BACD 这类大型 Sentinel-2 专用 burn model 是强 baseline,但其贡献更偏“数据工程 + 专用模型”。
4.3 SAM/自动标注路线
SAFE 说明 SAM + hotspot + Sentinel-2 fire index 可以生成高分 burned area 候选,并用于训练轻量区域模型。这条线适合解决标注稀缺,但 prompt、候选框、指数阈值和火点产品会把先验错误带进伪标签。它更适合作为 LoRA 训练数据扩增或人机标注 pipeline,而不是替代 GeoFM adapter。
4.4 GeoFM LoRA/adapter 路线
LoRA-GFM 的关键发现是:在 TerraMind、DINOv3、Prithvi-v2 上,LoRA 以小于 1% 的可训练参数获得更好的跨域泛化,Prithvi-v2 + LoRA 表现最好。这提示 wildfire mapping 的小切口可以是“参数高效适配如何抑制 overfitting”,而不是单纯追求最高 closed-set mIoU。
4.5 AlphaEarth embedding 路线
AlphaEarth 更像“年度地球表征产品”,优点是稀疏标签下的 map production,不必训练完整视觉主干。对于 wildfire,它可作为 sparse label baseline:用 AEF annual embeddings + pre/post year difference + linear probe / shallow MLP 来检测 burned area 或恢复状态。但 AEF 年度粒度可能不适合短时灾后响应;这是需要实证检验的限制。
5. 关键未解决问题
- 跨生态区泛化:针叶林、灌丛、草地、泥炭地、农地火灾的光谱变化不同;同一个 LoRA rank 是否能覆盖所有生态区还不清楚。
- 时间选择:pre-fire/post-fire 日期间隔、云量、物候阶段会显著影响 dNBR 和模型特征。多数论文没有把日期选择作为可学习或可评估模块。
- 云烟与阴影:火灾任务天然遇到 smoke/cloud/haze/shadow。很多 burn scar 模型用较干净影像训练,真实近实时场景会掉点。
- 标签边界不确定性:dNBR severity class 的边界不稳定;低 severity 与 unburned、moderate-low 与 moderate-high 常有生态解释差异,不应只用 hard CE loss。
- 事件级推理:chip-level mIoU 不等于完整 wildfire event 的面积估计好。LoRA-GFM repo 已包含 sliding-window full-fire inference 和 fire-size summaries,后续应把 event-level area error 作为主指标。
- LoRA 插入位置:ViT q/k/v、MLP、decoder、FPN adapter、temporal embedding、location embedding 哪些位置最值得适配,目前还缺 ablation。
- binary burned area vs severity:二分类 burned area 与 5 类 burn severity 需求不同;severity 更依赖生态现场知识,不确定性应更强。
6. 推荐论文课题
题目草案:Uncertainty-Aware Spatio-Temporal LoRA for Cross-Region Wildfire Burn Scar Mapping
核心假设:在 GeoFM 主干冻结或半冻结时,将 LoRA 放入多时相特征交互层,并显式建模标签/云烟/日期选择不确定性,可在跨生态区和跨时间 wildfire mapping 中优于 full fine-tuning、decoder-only fine-tuning 和普通 LoRA。
方法模块
- Bi-temporal input builder:为每个 wildfire event 自动选择 pre/post-fire Sentinel-2/HLS 影像,过滤云量,并生成 delta channels、dNBR、NBR、BAIS2 作为可选辅助输入。
- GeoFM backbones:Prithvi-EO-2.0 为主,TerraMind/DINOv3/Clay 作为对照;AlphaEarth embeddings 作为非端到端 sparse-feature baseline。
- LoRA placement ablation:比较 encoder attention LoRA、MLP LoRA、temporal embedding adapter、decoder-only、FPN adapter + UPerNet。
- Uncertainty head:输出 burned probability、severity logits、aleatoric uncertainty;对 dNBR 边界区域和 cloud/smoke 区域降低 hard supervision 权重。
- Event-level reconstruction:使用 sliding window + logit averaging,输出完整 fire polygon/mask,并报告面积误差和小火灾漏检。
- Cloud/smoke robustness augmentation:加入薄云、烟雾、阴影、季节差异和轻微 misregistration augmentation。
数据设计
| 数据 | 用途 | 备注 |
|---|---|---|
| LoRA-GFM wildfire events | 主实验 | 2017-2023 US/Canada 3,820 events;复现 spatio-temporal splits。 |
| HLS Burn Scars | 最小可复现 | 804 HLS scenes;适合快速比较 LoRA rank、decoder、loss。 |
| USGS BARC | severity label / weak label | 2025 data release;需要处理 dNBR 阈值和生态不确定性。 |
| CWGID | event-level detection / pretraining | 10 万+ Sentinel-2 before/after pairs;适合先做 event detection 或 hard negative mining。 |
| SAFE pseudo labels | 弱监督扩增 | 用 SAM + hotspot 生成候选,研究伪标签质量对 LoRA 的影响。 |
评价指标
- Pixel-level:IoU、F1、precision/recall、boundary F1。
- Event-level:burned area error、small/medium/large fire 分组 F1、per-fire IoU。
- Severity:macro F1、weighted F1、ordinal error、severity transition confusion。
- 泛化:leave-year-out、leave-region/ecoregion-out、US-to-Canada、Canada-to-US。
- 不确定性:ECE、Brier score、risk-coverage curve、cloud/smoke subset performance。
- 效率:trainable parameters、GPU memory、inference time、LoRA rank vs mIoU/F1。
7. 实验矩阵
| 实验 | Backbone | Adaptation | 输入 | Split | 主要指标 | 目的 |
|---|---|---|---|---|---|---|
| E1 | Prithvi-v2 | decoder-only | post only | random | IoU/F1 | 最弱 GeoFM baseline |
| E2 | Prithvi-v2 | full FT | pre+post | spatial | IoU/F1/area error | 检查 full FT 是否过拟合 |
| E3 | Prithvi-v2 | LoRA q/v | pre+post+delta | spatial/temporal | IoU/F1/ECE | 复现 LoRA-GFM 主结论 |
| E4 | Prithvi-v2 | LoRA + uncertainty | pre+post+delta+indices | ecoregion | F1/ECE/risk-coverage | 验证不确定性是否提升跨区稳健性 |
| E5 | TerraMind/DINOv3 | LoRA | pre+post+delta | same splits | F1/params | 比较主干差异 |
| E6 | AlphaEarth | linear/MLP | pre-year/post-year embedding diff | sparse label | F1/area error | 检验 embedding 产品的低样本价值 |
| E7 | U-Net/ChangeFormer | supervised | pre+post+indices | same splits | F1/area error | 非 GeoFM 强 baseline |
| E8 | SAFE pseudo labels + Prithvi | LoRA | post + hotspot pseudo mask | low-label | label cost/F1 | 研究自动标注对 LoRA 的帮助 |
8. 可投稿的小创新点
- Boundary-soft severity loss:根据 dNBR/BAIS2 与人工 severity class 的边界距离,为 low/moderate severity 区域引入 soft ordinal label。
- Date-selection adapter:把 pre/post 日期间隔、云量、NDVI 季节差作为 token 输入,让 LoRA 适配火前火后差异质量。
- Ecoregion-conditioned LoRA routing:按生态区或气候带选择 LoRA expert,但用共享低秩空间防止参数爆炸。
- Pseudo-label trust score:融合 SAFE/SAM mask stability、hotspot distance、dNBR consistency、GeoFM uncertainty,为伪标签分配权重。
- Event-level calibration:不只校准像素概率,还校准整场火灾面积估计的不确定性区间。
9. 最小可行复现实验
- 下载 HLS Burn Scars 做快速实验。
- 使用 Prithvi-EO-2.0/TerraTorch 初始化 backbone。
- 建立三组模型:decoder-only、full fine-tune、LoRA rank 4/8/16。
- 输入对比:post only、pre+post、pre+post+delta、pre+post+delta+NBR/dNBR。
- 指标:IoU、F1、ECE、area error。
- 再迁移到 LoRA-GFM 的 spatio-temporal splits,检验小实验结论是否成立。
10. 风险
- LoRA-GFM 依赖较新的 DINOv3/TerraMind/Prithvi-v2 wrapper,环境复现可能有摩擦。
- AlphaEarth 年度 embedding 对灾后短时间变化可能不够敏感,需要把它定位为 sparse-feature baseline。
- BARC/dNBR severity label 并非绝对真值,过度拟合 severity class 可能降低生态解释性。
- 云烟真实样本不足时,鲁棒性增强可能只是在合成扰动上有效。
- 若训练数据已覆盖同一 wildfire event 的相邻 tile,必须做 event-level split,避免地理泄漏。
评论