<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title>诚实性 - Tag - 堂堂一跑堂</title><link>https://spacetop.win/tags/%E8%AF%9A%E5%AE%9E%E6%80%A7/</link><description>诚实性 - Tag - 堂堂一跑堂</description><generator>Hugo -- gohugo.io</generator><language>zh-CN</language><managingEditor>kingcopper@whu.edu.cn (WangTong)</managingEditor><webMaster>kingcopper@whu.edu.cn (WangTong)</webMaster><lastBuildDate>Tue, 02 Jun 2026 12:00:00 +0800</lastBuildDate><atom:link href="https://spacetop.win/tags/%E8%AF%9A%E5%AE%9E%E6%80%A7/" rel="self" type="application/rss+xml"/><item><title>VHM：让遥感视觉语言模型既\"能干\"又\"诚实\"的AAAI 2025力作</title><link>https://spacetop.win/2026/06/20260602_120000_vhm_vision_language_model/</link><pubDate>Tue, 02 Jun 2026 12:00:00 +0800</pubDate><author><name>WangTong</name></author><guid>https://spacetop.win/2026/06/20260602_120000_vhm_vision_language_model/</guid><description><![CDATA[<h1 id="vhm让遥感视觉语言模型既能干又诚实的aaai-2025力作" class="headerLink">
    <a href="#vhm%e8%ae%a9%e9%81%a5%e6%84%9f%e8%a7%86%e8%a7%89%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e6%97%a2%e8%83%bd%e5%b9%b2%e5%8f%88%e8%af%9a%e5%ae%9e%e7%9a%84aaai-2025%e5%8a%9b%e4%bd%9c" class="header-mark"></a>VHM：让遥感视觉语言模型既&quot;能干&quot;又&quot;诚实&quot;的AAAI 2025力作</h1><blockquote>
  <p><strong>论文解读</strong> | AAAI 2025 | 2026-06-02</p>
</blockquote><h2 id="-论文信息" class="headerLink">
    <a href="#-%e8%ae%ba%e6%96%87%e4%bf%a1%e6%81%af" class="header-mark"></a>📄 论文信息</h2><table>
  <thead>
      <tr>
          <th>项目</th>
          <th>内容</th>
      </tr>
  </thead>
  <tbody>
      <tr>
          <td><strong>标题</strong></td>
          <td>VHM: Versatile and Honest Vision Language Model for Remote Sensing Image Analysis</td>
      </tr>
      <tr>
          <td><strong>作者</strong></td>
          <td>Chao Pang, Xingxing Weng, Jiang Wu, Jiayu Li, Yi Liu, Jiaxing Sun, Weijia Li, Shuai Wang, Litong Feng, Gui-Song Xia, Conghui He</td>
      </tr>
      <tr>
          <td><strong>机构</strong></td>
          <td>武汉大学、上海人工智能实验室、中山大学、商汤科技</td>
      </tr>
      <tr>
          <td><strong>会议</strong></td>
          <td>AAAI 2025</td>
      </tr>
      <tr>
          <td><strong>arXiv</strong></td>
          <td><a href="https://arxiv.org/abs/2403.20213" target="_blank" rel="noopener noreferrer">https://arxiv.org/abs/2403.20213</a></td>
      </tr>
      <tr>
          <td><strong>GitHub</strong></td>
          <td><a href="https://github.com/opendatalab/VHM" target="_blank" rel="noopener noreferrer">https://github.com/opendatalab/VHM</a></td>
      </tr>
      <tr>
          <td><strong>关键词</strong></td>
          <td>遥感视觉语言模型、多功能性、诚实性、大规模数据集、指令微调</td>
      </tr>
  </tbody>
</table>
<h2 id="-论文定位" class="headerLink">
    <a href="#-%e8%ae%ba%e6%96%87%e5%ae%9a%e4%bd%8d" class="header-mark"></a>📊 论文定位</h2><ul>
<li><strong>论文类型</strong>：实验验证型</li>
<li><strong>创新性评分</strong>：⭐⭐⭐⭐ (4分)</li>
<li><strong>判断依据</strong>：本文不仅提出了一个新的遥感视觉语言模型，更重要的是构建了大规模高质量数据集VersaD（140万图像-文本对）和创新性的&quot;诚实性&quot;训练范式。在数据稀缺的遥感VLM领域，这种&quot;数据+方法&quot;的双重贡献具有显著价值。</li>
</ul>
<h2 id="-解决的核心问题第一层表象层" class="headerLink">
    <a href="#-%e8%a7%a3%e5%86%b3%e7%9a%84%e6%a0%b8%e5%bf%83%e9%97%ae%e9%a2%98%e7%ac%ac%e4%b8%80%e5%b1%82%e8%a1%a8%e8%b1%a1%e5%b1%82" class="header-mark"></a>🎯 解决的核心问题（第一层：表象层）</h2><h3 id="问题背景" class="headerLink">
    <a href="#%e9%97%ae%e9%a2%98%e8%83%8c%e6%99%af" class="header-mark"></a>问题背景</h3><p>遥感图像分析正从传统的&quot;看图识物&quot;向&quot;理解对话&quot;转变。想象一下，你对着一张卫星图像问：&ldquo;这个区域有多少栋建筑？它们的用途是什么？周围有哪些配套设施？&quot;——这就是遥感视觉语言模型（RS-VLM）要做的事。</p>
<h3 id="现有方法的局限" class="headerLink">
    <a href="#%e7%8e%b0%e6%9c%89%e6%96%b9%e6%b3%95%e7%9a%84%e5%b1%80%e9%99%90" class="header-mark"></a>现有方法的局限</h3><p>然而，现有的遥感VLM面临两个致命问题：</p>]]></description></item></channel></rss>