GeoHeight-Bench: Towards Height-Aware Multimodal Reasoning in Remote Sensing<br>GeoHeight-Bench:迈向遥感中的高度感知多模态推理<br>[摘要](abstracts/2603.25565.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

当前地球观测领域的大型多模态模型通常忽略了关键的“垂直”维度,这限制了其在复杂遥感几何结构和灾害场景中的推理能力,因为在这些场景中,物理空间结构往往比平面视觉纹理更为重要。为弥补这一不足,我们引入了一个专门用于高度感知遥感理解的综合评估框架。首先,为克服标注数据严重匮乏的问题,我们开发了一个可扩展的、基于视觉语言模型的数据生成流程,利用系统化的提示工程和元数据提取技术。该流程构建了两个互补的基准:用于相对高度分析的GeoHeight-Bench,以及更具挑战性的、用于整体地形感知推理的GeoHeight-Bench+。此外,为验证高度感知的必要性,我们提出了首个高度感知遥感大型多模态模型基线——GeoHeightChat。作为一个强有力的概念验证,我们的基线模型表明,将视觉语义与隐式注入的高度几何特征相结合,能有效缓解“垂直盲点”问题,成功在现有光学模型中开启了交互式高度推理的新范式。

← Back