<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title>Cross-View Localization - Tag - 堂堂一跑堂</title><link>https://spacetop.win/tags/cross-view-localization/</link><description>Cross-View Localization - Tag - 堂堂一跑堂</description><generator>Hugo -- gohugo.io</generator><language>zh-CN</language><managingEditor>kingcopper@whu.edu.cn (WangTong)</managingEditor><webMaster>kingcopper@whu.edu.cn (WangTong)</webMaster><lastBuildDate>Sun, 14 Jun 2026 19:00:14 +0800</lastBuildDate><atom:link href="https://spacetop.win/tags/cross-view-localization/" rel="self" type="application/rss+xml"/><item><title>Fusing Satellite Imagery and Planimetric Maps for Cross-View Localization：卫星影像和 OSM 不能只选一个</title><link>https://spacetop.win/2026/06/20260614_190014_twohour_remote_sensing_radar/</link><pubDate>Sun, 14 Jun 2026 19:00:14 +0800</pubDate><author><name>WangTong</name></author><guid>https://spacetop.win/2026/06/20260614_190014_twohour_remote_sensing_radar/</guid><description><![CDATA[<h1 id="fusing-satellite-imagery-and-planimetric-maps-for-cross-view-localization卫星影像和-osm-不能只选一个" class="headerLink">
    <a href="#fusing-satellite-imagery-and-planimetric-maps-for-cross-view-localization%e5%8d%ab%e6%98%9f%e5%bd%b1%e5%83%8f%e5%92%8c-osm-%e4%b8%8d%e8%83%bd%e5%8f%aa%e9%80%89%e4%b8%80%e4%b8%aa" class="header-mark"></a>Fusing Satellite Imagery and Planimetric Maps for Cross-View Localization：卫星影像和 OSM 不能只选一个</h1><p><strong>结论：这一轮最值得单独跟踪的是 <em>Fusing Satellite Imagery and Planimetric Maps for Cross-View Localization</em>。它做的不是再造一个更大的 backbone，而是把一个很现实的问题摆到台面上：跨视角定位里，为什么总是默认只用卫星影像，明明平面地图和卫星图各有长处。论文给出一个很轻的融合模块，用 cross-modal conditioning 加 patch-level fusion，把 OpenStreetMap 这类平面地图和卫星影像一起喂给现成编码器，结果在 VIGOR 和 KITTI 上都比单模态更稳，KITTI 的 mean localization error 最好降到 3.85 m，较此前单模态最优方法低 30.13%。</strong></p>
<p>我按 2026-06-14 19:00 +08 检索公开来源，过滤 SAR、PolSAR、InSAR、radar-only、microwave-only 和 SAR-optical fusion 主线工作。这里选的是 2026-06-08 提交 arXiv 的 CV 论文，但它和遥感的关系很直接：输入一端是卫星影像，另一端是 OSM 平面地图，目标是地理定位。这类方法对遥感系统的价值，不在于它本身是“遥感专用网络”，而在于它给出了一个可迁移的多源融合模板。</p>
<h2 id="背景" class="headerLink">
    <a href="#%e8%83%8c%e6%99%af" class="header-mark"></a>背景</h2><p>跨视角定位一直有个老问题：地面视角和俯视视角差异太大。单靠卫星图，模型能看到建筑轮廓、道路纹理和街区形状，但在树冠遮挡、细粒度街景结构不清、或者局部语义歧义时，信息会不够。平面地图相反，它不一定像影像那样“真实”，但它有明确的对象标注，尤其在道路、街灯、建筑和路网结构上很强，遮挡区域也更稳。</p>
<p>之前很多工作默认“卫星图够用了”，或者把 OSM 当成辅助分支粗暴拼接。问题是，这样做常常只能看到形式上的融合，没有真正把两种模态的互补性吃进去。更糟的是，卫星图和地图在不同区域的可用性并不一样：有些地方 OSM 覆盖好，路网和 POI 丰富；有些地方地图稀疏，卫星图反而更可靠。于是，真正有价值的不是再加一条分支，而是让模型学会按区域、按 patch 动态决定该信谁。</p>
<p>这篇文章的定位很清楚：它要解决的不是遥感分类，而是“地理定位里的模态选择问题”。这对遥感侧的启发是直接的。很多 RS 系统也在走同样的路：卫星影像、栅格地图、矢量图、POI、建筑轮廓、道路拓扑，最后都要汇到一个定位或检索模型里。问题从来不是有没有数据，而是这些数据怎么协同。</p>]]></description></item></channel></rss>