Topo-R1: Detecting Topological Anomalies via Vision-Language Models<br>Topo-R1:基于视觉语言模型的拓扑异常检测<br>[摘要](abstracts/2603.13054.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

拓扑正确性对于血管、神经纤维和道路网络等管状结构至关重要。现有的拓扑保持方法依赖于特定领域的真实标注,成本高昂且难以跨领域迁移。当部署到缺乏标注的新领域时,一个关键问题随之浮现:如何在无真实标注监督的情况下检测拓扑异常?我们将此重新定义为拓扑异常检测任务,即一种结构化的视觉推理任务,要求模型在预测的分割掩码中定位并分类拓扑错误。视觉语言模型(VLMs)是天然的候选方案;然而,我们发现当前最先进的VLMs表现近乎随机,缺乏识别密集结构中稀疏连通性错误所需的细粒度、拓扑感知能力。为弥补这一差距,我们开发了一个自动数据生成流程,通过合成具有可验证标注的多样化拓扑异常,并逐步提升难度级别,从而构建了首个面向该任务的大规模、多领域基准。随后,我们提出了Topo-R1框架,该框架通过两阶段训练赋予VLMs拓扑感知能力:首先进行监督微调,然后采用基于组相对策略优化(GRPO)的强化学习。我们方法的核心在于一个拓扑感知的复合奖励机制,该机制整合了用于结构化错误分类的类型感知匈牙利匹配、空间定位评分,以及直接惩罚连通性中断的中心线Dice(clDice)奖励,从而共同激励语义精确性和结构保真度。大量实验表明,Topo-R1为无标注的拓扑质量评估建立了新范式,在所有评估协议中均持续优于通用VLMs及有监督基线方法。

← Back