DEX-AR: A Dynamic Explainability Method for Autoregressive Vision-Language Models<br>DEX-AR:一种面向自回归视觉语言模型的动态可解释性方法<br>[摘要](abstracts/2603.06302.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

随着视觉语言模型(VLMs)日益复杂且广泛应用,理解其决策过程变得愈发关键。传统可解释性方法专为分类任务设计,难以应对现代自回归VLMs,因其涉及复杂的逐令牌生成过程以及视觉与文本模态间的精细交互。本文提出DEX-AR(自回归模型动态可解释性方法),这是一种新颖的可解释性方法,通过生成逐令牌和序列级别的二维热力图,突出显示对模型文本响应至关重要的图像区域,以应对上述挑战。该方法通过在逐令牌生成过程中计算注意力图对应的分层梯度,实现对自回归VLMs(包括不同层和生成令牌的重要性变化)的解读。DEX-AR引入两大关键创新:一是动态头过滤机制,用于识别专注于视觉信息的注意力头;二是序列级过滤方法,在区分视觉相关令牌与纯语言令牌的同时,聚合逐令牌解释。我们在ImageNet、VQAv2和PascalVOC数据集上的评估表明,该方法在使用新型归一化困惑度指标的基于扰动的度量,以及基于分割的度量上均取得了持续改进。

← Back