<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title>DINOv3 - Tag - 堂堂一跑堂</title><link>https://spacetop.win/tags/dinov3/</link><description>DINOv3 - Tag - 堂堂一跑堂</description><generator>Hugo -- gohugo.io</generator><language>zh-CN</language><managingEditor>kingcopper@whu.edu.cn (WangTong)</managingEditor><webMaster>kingcopper@whu.edu.cn (WangTong)</webMaster><lastBuildDate>Tue, 16 Jun 2026 15:00:04 +0800</lastBuildDate><atom:link href="https://spacetop.win/tags/dinov3/" rel="self" type="application/rss+xml"/><item><title>DEO：用双教师蒸馏把 DINOv3 的 RGB 语义注入多光谱 GeoFM</title><link>https://spacetop.win/2026/06/20260616_150004_twohour_remote_sensing_radar/</link><pubDate>Tue, 16 Jun 2026 15:00:04 +0800</pubDate><author><name>WangTong</name></author><guid>https://spacetop.win/2026/06/20260616_150004_twohour_remote_sensing_radar/</guid><description><![CDATA[<h1 id="deo用双教师蒸馏把-dinov3-的-rgb-语义注入多光谱-geofm" class="headerLink">
    <a href="#deo%e7%94%a8%e5%8f%8c%e6%95%99%e5%b8%88%e8%92%b8%e9%a6%8f%e6%8a%8a-dinov3-%e7%9a%84-rgb-%e8%af%ad%e4%b9%89%e6%b3%a8%e5%85%a5%e5%a4%9a%e5%85%89%e8%b0%b1-geofm" class="header-mark"></a>DEO：用双教师蒸馏把 DINOv3 的 RGB 语义注入多光谱 GeoFM</h1><p><strong>结论：这一轮最值得补进雷达的是 CVPR 2026 Highlight 论文 <em>Brewing Stronger Features: Dual-Teacher Distillation for Multispectral Earth Observation</em>。它提出 DEO，用一个多光谱 EMA teacher 学 Sentinel-2 10 通道表示，再用冻结的光学 VFM teacher（默认 DINOv3）把 RGB 语义和 patch-level 结构蒸馏到同一个学生模型里。论文的关键信号不是“再训练一个遥感 backbone”，而是把通用视觉基础模型和多光谱 EO 基础模型之间的接口说清楚：如果目标是让 RGB 光学语义迁移到多光谱，预训练目标最好和 DINO/DINOv3 这类 contrastive self-distillation 范式对齐，而不是只靠 masked image modeling 做局部重建。</strong></p>
<p>我按 2026-06-16 15:00 +08 检索公开来源，并过滤 SAR、PolSAR、InSAR、radar-only、microwave-only 与 SAR-optical fusion 主线工作。DEO 的训练主线是 fMoW-Sentinel / fMoW-RGB 的光学与 Sentinel-2 多光谱数据；论文确实在相关工作和对比方法中提到含雷达路线，但本篇只讨论它对非 SAR 光学/多光谱 GeoFM 的价值。同期本地文章已经覆盖 FusionRS、RATS、Gaze Heads、TTABC、Clay-CNN Hybrids、AI4Land、MaskWAM、GeoFM layer probing、CoastlineVLM、Stateful Visual Encoders、LG-SAM、VecLang、TerraBench、OSTB 等方向，因此这里不重复已有条目。</p>]]></description></item><item><title>ZODS-RS：DINOv3+SAM2 的零训练遥感检测与实例分割</title><link>https://spacetop.win/2026/06/20260612_150002_twohour_remote_sensing_radar/</link><pubDate>Fri, 12 Jun 2026 15:00:03 +0800</pubDate><author><name>WangTong</name></author><guid>https://spacetop.win/2026/06/20260612_150002_twohour_remote_sensing_radar/</guid><description><![CDATA[<h1 id="zods-rsdinov3sam2-的零训练遥感检测与实例分割" class="headerLink">
    <a href="#zods-rsdinov3sam2-%e7%9a%84%e9%9b%b6%e8%ae%ad%e7%bb%83%e9%81%a5%e6%84%9f%e6%a3%80%e6%b5%8b%e4%b8%8e%e5%ae%9e%e4%be%8b%e5%88%86%e5%89%b2" class="header-mark"></a>ZODS-RS：DINOv3+SAM2 的零训练遥感检测与实例分割</h1><p><strong>结论：这一轮值得单独跟踪的是 ZODS-RS，不是因为它的绝对精度已经压过监督检测器，而是因为它把遥感检测/实例分割推向了一个更实用的基线问题：如果不给新地区、新平台、新目标重新标注和训练，冻结的 DINOv3 特征、SAM2 proposals 和一组闭式匹配规则，到底能做到什么程度。</strong></p>
<p>我按 2026-06-12 15:00 +08 检索公开来源，过滤了 SAR、PolSAR、InSAR、radar-only、microwave-only 和 SAR-optical fusion 项。ZODS-RS 的任务是航空/UAV/高分辨率光学遥感目标检测与实例分割，核心来源是 arXiv:2606.10769；截至本次检查，没有检索到官方 GitHub 仓库，因此本文把它作为“论文信号 + 待复现基线”处理，而不是已经可直接跑通的开源项目。</p>
<h2 id="摘要" class="headerLink">
    <a href="#%e6%91%98%e8%a6%81" class="header-mark"></a>摘要</h2><p>ZODS-RS 的全名是 <em>Zero-training Oriented Detection &amp; Segmentation for Remote Sensing</em>，2026-06-09 提交 arXiv。论文提出一个 training-free、closed-form 的遥感/无人机影像流程，输出 horizontal bounding boxes（HBB）和 instance masks。它不训练新的检测器，而是把 DINOv3 dense features、SAM-style proposals、memory/prototype 机制串起来，再用 prototype purification、rotation-scale equivariant matching、uncertainty-aware pixelwise merging 做推理期匹配和合并。</p>
<p>这个工作最值得看的地方是问题设定。遥感检测长期依赖 DOTA、FAIR1M、xView 这类标注数据训练专用模型，但真实应用常常是“换一个地区、换一个平台、换一个类别，就没有足够标签”。ZODS-RS 问的是：能否用通用视觉基础模型的 frozen dense features，加上遥感几何约束，做一个不训练也能工作的 detection + segmentation baseline。它的分数不应和 fully supervised detector 直接硬比，而应和 Grounded-SAM、open-vocabulary detector、SAM proposal pipeline、DINO feature matching 这类低标注/零训练方案比较。</p>]]></description></item></channel></rss>