<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title>地图配准 - Tag - 堂堂一跑堂</title><link>https://spacetop.win/tags/%E5%9C%B0%E5%9B%BE%E9%85%8D%E5%87%86/</link><description>地图配准 - Tag - 堂堂一跑堂</description><generator>Hugo -- gohugo.io</generator><language>zh-CN</language><managingEditor>kingcopper@whu.edu.cn (WangTong)</managingEditor><webMaster>kingcopper@whu.edu.cn (WangTong)</webMaster><lastBuildDate>Sun, 14 Jun 2026 11:00:02 +0800</lastBuildDate><atom:link href="https://spacetop.win/tags/%E5%9C%B0%E5%9B%BE%E9%85%8D%E5%87%86/" rel="self" type="application/rss+xml"/><item><title>Plan2Map：别让 VLM 直接手写 GeoJSON</title><link>https://spacetop.win/2026/06/20260614_110001_twohour_remote_sensing_radar/</link><pubDate>Sun, 14 Jun 2026 11:00:02 +0800</pubDate><author><name>WangTong</name></author><guid>https://spacetop.win/2026/06/20260614_110001_twohour_remote_sensing_radar/</guid><description><![CDATA[<h1 id="plan2map别让-vlm-直接手写-geojson" class="headerLink">
    <a href="#plan2map%e5%88%ab%e8%ae%a9-vlm-%e7%9b%b4%e6%8e%a5%e6%89%8b%e5%86%99-geojson" class="header-mark"></a>Plan2Map：别让 VLM 直接手写 GeoJSON</h1><p><strong>结论：这一轮最值得单独跟踪的是 <em>Plan2Map: A Multimodal Benchmark for Document-Grounded Geospatial Boundary Reconstruction from Planning Records</em>。它不是传统遥感影像分类或分割论文，而是把一个很真实的地理智能问题做成 benchmark：给系统一份规划 PDF，里面有通知文本、法律描述、扫描地图、标签和边界标注，要求系统还原可评分的 GeoJSON 边界。最有价值的结论很直接：端到端让 VLM 直接生成 GeoJSON 几乎不可靠；更稳的路线是让 VLM 读证据、让 GIS 工具定位和配准、让分割模型提边界，再把 mask 投影回 WGS84。</strong></p>
<p>我按 2026-06-14 11:00 +08 检索公开来源，过滤 SAR、PolSAR、InSAR、radar-only、microwave-only 和 SAR-optical fusion 主线工作。本篇选择 2026-06-01 提交 arXiv 的 Plan2Map。arXiv 和项目页均已公开；项目页标注 Code 和 Dataset 为 coming soon，因此本文把它视为“论文与项目页公开、代码和数据集尚未释放”的条目。</p>
<p>这篇适合放进“多源数据融合、效率部署与应用落地”。原因是它的核心不是单个视觉 encoder，而是把文档解析、地名检索、地图瓦片匹配、边界分割、坐标投影和结果校验串成一个可执行地理工作流。对遥感 VLM、GeoAgent 和地图自动化来说，它比单图 VQA 更接近真实业务。</p>
<h2 id="背景" class="headerLink">
    <a href="#%e8%83%8c%e6%99%af" class="header-mark"></a>背景</h2><p>很多地理空间信息并不是一开始就以 GeoJSON、Shapefile 或标准数据库形式存在。城市规划、历史保护区、建设限制、土地使用规则、环境红线和基础设施管控范围，常常只存在于 PDF、扫描件、公告文本、附图和地方政府网页里。人能读懂“某条路以东、某条边界线内、图中黄色区域”，但机器要把它变成可查询的边界并不容易。</p>
<p>Plan2Map 关注的是英国 Article 4 Direction 规划记录。它们定义了某些区域上的规划限制，但源文件往往只给法律通知和附图，不直接给机器可读的边界。数字规划系统真正需要的是几何对象：一个地点是否落在限制区内，某个限制是否和其他规则重叠，历史记录是否能被审计，这些都需要可计算边界。</p>
<p>这类任务和遥感 AI 的关系很近。遥感模型经常输出 mask、检测框或变化区域，但落地时必须和地籍、道路、行政边界、规划文档、地名库和地图瓦片对齐。也就是说，问题不只是“图里有什么”，而是“来自不同来源的证据能不能被合成一个合法、可验证、可投影的空间对象”。</p>]]></description></item></channel></rss>