GeoRouter: Dynamic Paradigm Routing for Worldwide Image Geolocalization<br>GeoRouter:面向全球图像地理定位的动态范式路由<br>[摘要](abstracts/2603.24376.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

全球图像地理定位旨在为地球上任意地点拍摄的图像预测精确的GPS坐标,由于视觉和地理多样性巨大,这一任务极具挑战性。现有方法主要遵循两种范式:基于检索的方法,通过将查询与参考数据库进行匹配;以及基于生成的方法,利用大型视觉语言模型(LVLM)直接预测坐标。然而,我们观察到两者存在明显的误差特征:检索方法擅长细粒度的实例匹配,而生成方法则提供鲁棒的语义推理能力。这种互补的异质性表明,单一范式并非普遍最优。为充分利用这一潜力,我们提出了GeoRouter,一种动态路由框架,能够自适应地为每个查询分配最优范式。GeoRouter利用LVLM主干网络分析视觉内容并提供路由决策。为优化GeoRouter,我们引入了一种距离感知的偏好目标,将范式间的距离差距转化为连续的监督信号,从而明确反映相对性能差异。此外,我们构建了GeoRouting,这是首个专为训练具有独立范式预测的路由策略而设计的大规模数据集。在IM2GPS3k和YFCC4k上的大量实验表明,GeoRouter显著优于当前最先进的基线方法。

← Back