RS-42 Wildfire Mapping with GeoFM LoRA

Series - 2024-2026 遥感 AI 细分研究方向

RS-42 Wildfire Mapping with GeoFM LoRA

细问题:面向 wildfire / burn scar / burn severity mapping,如何用低样本、参数高效的 GeoFM adapter/LoRA 适配 Prithvi、TerraMind、DINOv3、AlphaEarth 等遥感基础模型,并处理 pre/post-fire 光学影像、云烟干扰、不确定性和跨地区泛化。

Wildfire mapping 的经典路线是 NBR/dNBR、BAIS2、阈值、随机森林、U-Net/Siamese U-Net、ChangeFormer 一类变化检测模型。2024-2026 的新变化是:基础模型开始进入真正可复现的 wildfire 任务,而不只是“拿 Prithvi 做一个示例”。其中最直接的锚点是 2026 IGARSS 论文 Low-Rank Adaptation of Geospatial Foundation Models for Wildfire Mapping Using Sentinel-2 Data,其官方代码为 alishibli97/wildfire-lora-gfm

这个方向的研究价值不在于“再做一个烧毁区分割模型”,而在于回答一个更窄的问题:在地理、时间、生态区和传感器条件都变化的情况下,LoRA/adapter 是否比 full fine-tuning 或 decoder-only fine-tuning 更稳,尤其是在小样本事件、云烟遮挡、火后恢复阶段、跨国家/跨生态区泛化时。

  1. 火烧迹地是典型的 bi-temporal change problem。单张 post-fire 影像容易把裸土、采伐地、阴影、火山/矿区等误判为 burned area;pre-fire/post-fire 差分能增强变化信号,但也会引入季节、物候、云影、观测角和配准误差。
  2. 标签天然有噪声。USGS BARC 数据说明 burn severity 产品通常基于 pre/post-fire 的 dNBR,并且阈值需要 BAER 团队结合现场观察调整;这意味着 severity label 在生态区边界和低/中 severity 类别上并不是绝对真值。
  3. 跨地区泛化比随机切分难得多。2026 LoRA-GFM 论文使用美国和加拿大 2017-2023 的 3,820 个 wildfire events,并做 spatial/temporal generalization tests;这是该方向从“局部案例”走向“域泛化问题”的关键。
  4. GeoFM 的预训练知识有用,但灾害任务需要强适配。Prithvi-EO-2.0 预训练于 HLS 全球时间序列,并引入 temporal/location embeddings;这对 wildfire 这种多时相任务很友好,但仍需解决任务头、差分建模和不确定性。
项目年份/venue链接与本方向的关系
Low-Rank Adaptation of Geospatial Foundation Models for Wildfire Mapping Using Sentinel-2 Data2026 IGARSS / arXivpaper, GitHub直接比较 TerraMind、DINOv3、Prithvi-v2 的 full fine-tuning、decoder-only fine-tuning、LoRA;官方 README 显示包含 FPN adapter、UPerNet decoder、spatio-temporal splits、sliding-window full-fire inference、IoU/F1 和 fire-size summaries。
Prithvi-EO-2.02024 arXiv, 2026 revisedpaper, GitHub多时相 HLS GeoFM。论文摘要称其使用 4.2M 全球 HLS time-series samples,并提供 Hugging Face、TerraTorch 与 GitHub 资源;适合作为 wildfire LoRA 主干。
Prithvi EO 2.0 Burn Scar Severity Detection2024/2025 HF model cardmodel, dataset一个可直接运行的 Prithvi burn scar severity demo。输入为 pre-fire、post-fire、delta 三帧,6 个 Sentinel-2 band,输出 5 类 severity。模型卡自报 macro F1 从 0.116 提升到 0.622,但其限制也明确:单一北加州 wildfire 事件、云烟未评估、20m 分辨率可能漏细节。
HLS Burn Scars DatasetHF datasetdatasetHLS 2018-2021 CONUS burn scar segmentation,804 个 512x512 scenes,6 个 band,540 train / 264 validation;适合最小复现实验和 adapter sanity check。
AlphaEarth Foundations2025 arXiv / Google DeepMindpaper, blog64 维年度 embedding field,面向 sparse labels 的 global mapping。更适合做 linear probe / shallow adapter / sparse-label baseline,而不是端到端 LoRA。可用于 wildfire 小样本或跨区迁移对照。
Burned Area Reflectance Classification (BARC) Thematic Burn Severity Mosaic2025 USGS data releaseUSGS catalog权威 severity label 来源之一。基于 Landsat/Sentinel pre/post-fire dNBR,但官方说明 severity 与 canopy/understory/soil effects 相关,且阈值需与现场观测调整,因此很适合讨论标签不确定性。
SAFE: Segmentation of Any Fire Event2025 Remote Sensingpaper训练自由路线:结合 SAM、MODIS/VIIRS hotspot、Sentinel-2 指数两步定位 burned area,并可生成高分辨率数据再训练区域模型。适合作为伪标签或半自动标注对照。
California Wildfire GeoImaging Dataset (CWGID)2024 arXivpaper构建 10 万+ before/after Sentinel-2 image pairs,用于 wildfire detection;偏分类/检测而非高精度 burn mask,但可用于预训练或事件级检索。
Faster, better, and more accurate mapping of burned areas using Sentinel-2 multispectral images2025 RSEScienceDirectMSR-BACD 路线:全球大规模正负样本、pre/post Sentinel-2、candidate-based inference。可作为强监督专用模型 baseline。
TransFireNet2025 Remote Sensing Letterspublisherbi-temporal Sentinel-2 burn severity estimation,45 个 European wildfire events;适合作为非 GeoFM 的 burn severity baseline。

NBR/dNBR、BAIS2、NDVI/NDWI 等指数可解释、低成本、部署简单,但跨生态区阈值不稳,对云影、裸土、采伐、湿地和季节变化敏感。BARC 的说明很适合用来支撑一个观点:severity label 不是纯影像数学事实,而是遥感指数、生态效应和现场知识的折中。

U-Net/Siamese U-Net/Transformer change models 可以利用 pre/post-fire 差异,在固定区域内通常强于指数阈值。但它们容易学到区域、植被类型和季节偏置;跨国家/跨生态区时需要大量标注。MSR-BACD 这类大型 Sentinel-2 专用 burn model 是强 baseline,但其贡献更偏“数据工程 + 专用模型”。

SAFE 说明 SAM + hotspot + Sentinel-2 fire index 可以生成高分 burned area 候选,并用于训练轻量区域模型。这条线适合解决标注稀缺,但 prompt、候选框、指数阈值和火点产品会把先验错误带进伪标签。它更适合作为 LoRA 训练数据扩增或人机标注 pipeline,而不是替代 GeoFM adapter。

LoRA-GFM 的关键发现是:在 TerraMind、DINOv3、Prithvi-v2 上,LoRA 以小于 1% 的可训练参数获得更好的跨域泛化,Prithvi-v2 + LoRA 表现最好。这提示 wildfire mapping 的小切口可以是“参数高效适配如何抑制 overfitting”,而不是单纯追求最高 closed-set mIoU。

AlphaEarth 更像“年度地球表征产品”,优点是稀疏标签下的 map production,不必训练完整视觉主干。对于 wildfire,它可作为 sparse label baseline:用 AEF annual embeddings + pre/post year difference + linear probe / shallow MLP 来检测 burned area 或恢复状态。但 AEF 年度粒度可能不适合短时灾后响应;这是需要实证检验的限制。

  1. 跨生态区泛化:针叶林、灌丛、草地、泥炭地、农地火灾的光谱变化不同;同一个 LoRA rank 是否能覆盖所有生态区还不清楚。
  2. 时间选择:pre-fire/post-fire 日期间隔、云量、物候阶段会显著影响 dNBR 和模型特征。多数论文没有把日期选择作为可学习或可评估模块。
  3. 云烟与阴影:火灾任务天然遇到 smoke/cloud/haze/shadow。很多 burn scar 模型用较干净影像训练,真实近实时场景会掉点。
  4. 标签边界不确定性:dNBR severity class 的边界不稳定;低 severity 与 unburned、moderate-low 与 moderate-high 常有生态解释差异,不应只用 hard CE loss。
  5. 事件级推理:chip-level mIoU 不等于完整 wildfire event 的面积估计好。LoRA-GFM repo 已包含 sliding-window full-fire inference 和 fire-size summaries,后续应把 event-level area error 作为主指标。
  6. LoRA 插入位置:ViT q/k/v、MLP、decoder、FPN adapter、temporal embedding、location embedding 哪些位置最值得适配,目前还缺 ablation。
  7. binary burned area vs severity:二分类 burned area 与 5 类 burn severity 需求不同;severity 更依赖生态现场知识,不确定性应更强。

题目草案:Uncertainty-Aware Spatio-Temporal LoRA for Cross-Region Wildfire Burn Scar Mapping

核心假设:在 GeoFM 主干冻结或半冻结时,将 LoRA 放入多时相特征交互层,并显式建模标签/云烟/日期选择不确定性,可在跨生态区和跨时间 wildfire mapping 中优于 full fine-tuning、decoder-only fine-tuning 和普通 LoRA。

  1. Bi-temporal input builder:为每个 wildfire event 自动选择 pre/post-fire Sentinel-2/HLS 影像,过滤云量,并生成 delta channels、dNBR、NBR、BAIS2 作为可选辅助输入。
  2. GeoFM backbones:Prithvi-EO-2.0 为主,TerraMind/DINOv3/Clay 作为对照;AlphaEarth embeddings 作为非端到端 sparse-feature baseline。
  3. LoRA placement ablation:比较 encoder attention LoRA、MLP LoRA、temporal embedding adapter、decoder-only、FPN adapter + UPerNet。
  4. Uncertainty head:输出 burned probability、severity logits、aleatoric uncertainty;对 dNBR 边界区域和 cloud/smoke 区域降低 hard supervision 权重。
  5. Event-level reconstruction:使用 sliding window + logit averaging,输出完整 fire polygon/mask,并报告面积误差和小火灾漏检。
  6. Cloud/smoke robustness augmentation:加入薄云、烟雾、阴影、季节差异和轻微 misregistration augmentation。
数据用途备注
LoRA-GFM wildfire events主实验2017-2023 US/Canada 3,820 events;复现 spatio-temporal splits。
HLS Burn Scars最小可复现804 HLS scenes;适合快速比较 LoRA rank、decoder、loss。
USGS BARCseverity label / weak label2025 data release;需要处理 dNBR 阈值和生态不确定性。
CWGIDevent-level detection / pretraining10 万+ Sentinel-2 before/after pairs;适合先做 event detection 或 hard negative mining。
SAFE pseudo labels弱监督扩增用 SAM + hotspot 生成候选,研究伪标签质量对 LoRA 的影响。
  • Pixel-level:IoU、F1、precision/recall、boundary F1。
  • Event-level:burned area error、small/medium/large fire 分组 F1、per-fire IoU。
  • Severity:macro F1、weighted F1、ordinal error、severity transition confusion。
  • 泛化:leave-year-out、leave-region/ecoregion-out、US-to-Canada、Canada-to-US。
  • 不确定性:ECE、Brier score、risk-coverage curve、cloud/smoke subset performance。
  • 效率:trainable parameters、GPU memory、inference time、LoRA rank vs mIoU/F1。
实验BackboneAdaptation输入Split主要指标目的
E1Prithvi-v2decoder-onlypost onlyrandomIoU/F1最弱 GeoFM baseline
E2Prithvi-v2full FTpre+postspatialIoU/F1/area error检查 full FT 是否过拟合
E3Prithvi-v2LoRA q/vpre+post+deltaspatial/temporalIoU/F1/ECE复现 LoRA-GFM 主结论
E4Prithvi-v2LoRA + uncertaintypre+post+delta+indicesecoregionF1/ECE/risk-coverage验证不确定性是否提升跨区稳健性
E5TerraMind/DINOv3LoRApre+post+deltasame splitsF1/params比较主干差异
E6AlphaEarthlinear/MLPpre-year/post-year embedding diffsparse labelF1/area error检验 embedding 产品的低样本价值
E7U-Net/ChangeFormersupervisedpre+post+indicessame splitsF1/area error非 GeoFM 强 baseline
E8SAFE pseudo labels + PrithviLoRApost + hotspot pseudo masklow-labellabel cost/F1研究自动标注对 LoRA 的帮助
  1. Boundary-soft severity loss:根据 dNBR/BAIS2 与人工 severity class 的边界距离,为 low/moderate severity 区域引入 soft ordinal label。
  2. Date-selection adapter:把 pre/post 日期间隔、云量、NDVI 季节差作为 token 输入,让 LoRA 适配火前火后差异质量。
  3. Ecoregion-conditioned LoRA routing:按生态区或气候带选择 LoRA expert,但用共享低秩空间防止参数爆炸。
  4. Pseudo-label trust score:融合 SAFE/SAM mask stability、hotspot distance、dNBR consistency、GeoFM uncertainty,为伪标签分配权重。
  5. Event-level calibration:不只校准像素概率,还校准整场火灾面积估计的不确定性区间。
  1. 下载 HLS Burn Scars 做快速实验。
  2. 使用 Prithvi-EO-2.0/TerraTorch 初始化 backbone。
  3. 建立三组模型:decoder-only、full fine-tune、LoRA rank 4/8/16。
  4. 输入对比:post only、pre+post、pre+post+delta、pre+post+delta+NBR/dNBR。
  5. 指标:IoU、F1、ECE、area error。
  6. 再迁移到 LoRA-GFM 的 spatio-temporal splits,检验小实验结论是否成立。
  • LoRA-GFM 依赖较新的 DINOv3/TerraMind/Prithvi-v2 wrapper,环境复现可能有摩擦。
  • AlphaEarth 年度 embedding 对灾后短时间变化可能不够敏感,需要把它定位为 sparse-feature baseline。
  • BARC/dNBR severity label 并非绝对真值,过度拟合 severity class 可能降低生态解释性。
  • 云烟真实样本不足时,鲁棒性增强可能只是在合成扰动上有效。
  • 若训练数据已覆盖同一 wildfire event 的相邻 tile,必须做 event-level split,避免地理泄漏。
  1. Low-Rank Adaptation of Geospatial Foundation Models for Wildfire Mapping Using Sentinel-2 Data
  2. wildfire-lora-gfm official code
  3. Prithvi-EO-2.0 paper and GitHub
  4. HLS Burn Scars Dataset
  5. USGS BARC Thematic Burn Severity Mosaic
  6. SAFE burned area extraction
  7. AlphaEarth Foundations

Related Content

评论