MAESTRO：多模态多时相多光谱遥感自监督学习的\"指挥家\"

Mon, 01 Jun 2026 12:00:00 +0800

MAESTRO：多模态多时相多光谱遥感自监督学习的"指挥家"

论文解读 | WACV 2026 | 2026-06-01

项目	内容
标题	MAESTRO: Masked AutoEncoders for Multimodal, Multitemporal, and Multispectral Earth Observation Data
作者	Antoine Labatie, Michael Vaccaro, Nina Lardiere, Anatol Garioud, Nicolas Gonthier
会议	WACV 2026 (IEEE/CVF Winter Conference on Applications of Computer Vision)
arXiv	https://arxiv.org/abs/2508.10894
GitHub	https://github.com/ignf/maestro
关键词	自监督学习, 掩码自编码器, 多模态融合, 多时相分析, 多光谱遥感, 地球观测

地球观测（Earth Observation, EO）数据具有独特的"三多"特性：

这些特性使得直接将自然图像领域的自监督学习方法（如MAE）迁移到遥感领域存在根本性挑战。

方法类型	局限性
单模态MAE	忽略多模态互补信息，无法充分利用SAR、DEM等数据
简单拼接融合	将所有模态/时相强行拼接，导致异质数据相互干扰
晚期融合	各模态独立编码后融合，丢失跨模态交互信息
统一tokenizer	用同一套tokenizer处理所有模态，忽略传感器特性差异

如何设计一个统一的自监督学习框架，能够高效地融合多模态、多时相、多光谱的遥感数据，同时保持计算效率？