TAU-R1: Visual Language Model for Traffic Anomaly Understanding<br>TAU-R1:面向交通异常理解的可视语言模型<br>[摘要](abstracts/2603.19098.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

交通异常理解(TAU)对于智能交通系统中的交通安全至关重要。近年来,视觉语言模型(VLMs)在视频理解方面展现出强大能力。然而,由于缺乏基准数据集和任务专用方法,TAU领域的研究进展仍受限。为应对这一局限,我们引入了Roundabout-TAU数据集,该数据集基于与印第安纳州卡梅尔市合作采集的真实世界环岛交通视频构建,包含342个视频片段,并标注了超过2000个涵盖交通异常理解多维度的问题-答案对。基于此基准,我们提出了TAU-R1——一个双层视觉语言框架用于TAU任务。第一层为轻量级异常分类器,执行粗略的异常分类;第二层为大型异常推理器,生成详细的事件摘要。为提升任务专用推理能力,我们设计了一种两阶段训练策略:先进行分解式问答增强的监督微调,再采用TAU-GRPO——一种基于GRPO的后训练方法,并配备TAU专用奖励函数。实验结果表明,TAU-R1在异常分类与推理任务上均表现出色,同时保持了部署效率。数据集与代码已开源:https://github.com/siri-rouser/TAU-R1

← Back