Topo-R1: Detecting Topological Anomalies via Vision-Language Models<br>Topo-R1：基于视觉语言模型的拓扑异常检测<br>[摘要](abstracts/2603.13054.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

拓扑正确性对于血管、神经纤维和道路网络等管状结构至关重要。现有的拓扑保持方法依赖于特定领域的真实标注，成本高昂且难以跨领域迁移。当部署到缺乏标注的新领域时，一个关键问题随之浮现：如何在无真实标注监督的情况下检测拓扑异常？我们将此重新定义为拓扑异常检测任务，即一种结构化的视觉推理任务，要求模型在预测的分割掩码中定位并分类拓扑错误。视觉语言模型（VLMs）是天然的候选方案；然而，我们发现当前最先进的VLMs表现近乎随机，缺乏识别密集结构中稀疏连通性错误所需的细粒度、拓扑感知能力。为弥补这一差距，我们开发了一个自动数据生成流程，通过合成具有可验证标注的多样化拓扑异常，并逐步提升难度级别，从而构建了首个面向该任务的大规模、多领域基准。随后，我们提出了Topo-R1框架，该框架通过两阶段训练赋予VLMs拓扑感知能力：首先进行监督微调，然后采用基于组相对策略优化（GRPO）的强化学习。我们方法的核心在于一个拓扑感知的复合奖励机制，该机制整合了用于结构化错误分类的类型感知匈牙利匹配、空间定位评分，以及直接惩罚连通性中断的中心线Dice（clDice）奖励，从而共同激励语义精确性和结构保真度。大量实验表明，Topo-R1为无标注的拓扑质量评估建立了新范式，在所有评估协议中均持续优于通用VLMs及有监督基线方法。

← Back